angle-left null Ứng dụng công nghệ thông tin trong điều tra thống kê và chia sẻ dữ liệu với các bộ, ngành
Trang chủ

21/05/2020 07:18

(data.gov.vn) Công nghệ thông tin được coi là một trong các trụ cột nâng cao chất lượng số liệu thống kê và đặc biệt quan trọng trong bối cảnh ứng dụng Chính phủ điện tử và cuộc cách mạng công nghiệp 4.0. Luật Thống kê quy định Nhà nước ưu tiên đầu tư phát triển và ứng dụng công nghệ thông tin - truyền thông tiên tiến trong hoạt động thống kê nhà nước

Trong những năm qua Tổng cục Thống kê ứng dụng công nghệ thông tin mạnh mẽ trong công tác thống kê nói chung và trong điều tra thống kê, chia sẻ dữ liệu với các bộ, ngành nói riêng.

1. Kết quả đạt được

1.1. Ứng dụng CNTT trong điều tra thống kê

Triển khai Quyết định số 501/QĐ-TTg ngày 10/5/2019 của Thủ tướng Chính phủ về việc phê duyệt Đề án Ứng dụng CNTT-TT trong Hệ thống thống kê nhà nước giai đoạn 2017 - 2025, tầm nhìn đến năm 2030 (viết gọn là Đề án 501), Tổng cục Thống kê đã thực hiện nhiều hoạt động ứng dụng CNTT liên quan phục vụ điều tra thống kê, cụ thể;

Một là chuẩn hóa quy trình nghiệp vụ: Tiếp tục ứng dụng quy trình sản xuất thông tin thống kê (GSBPM) đã được ban hành mô hình cấp cao theo quyết định số Quyết định số 945/QĐ-TCTK ngày 24/9/2013 của Tổng cục trưởng Tổng cục Thống kê, Dự án hỗ trợ kỹ thuật của Italia đang giúp ngành Thống kê xác định và xây dựng các chuẩn mực thống kê từ đó xây dựng quy trình sản xuất thông tin thống kê cấp chi tiết. Để giám sát việc tuân thủ quy trình, Tổng cục đang nghiên cứu và sẽ triển khai ứng dụng công cụ Mô hình hiện đại hóa hoàn thiện (Modernisation Maturity Model - MMM).

Hai là ứng dụng phiếu điều tra điện tử: Ngành Thống kê đã ứng dụng thành công phiếu điều tra điện tử (CAPI và webform) trong Tổng điều tra dân số và nhà ở năm 2019 đạt 99,9% (cao hơn so với mục tiêu của Đề án 501 là 80%) giúp rút ngắn thời gian thu thập thông tin và xử lý kết quả Tổng điều tra so với phương pháp truyền thống (sử dụng phiếu giấy sau đó nhập tin bàn phím hoặc quét phiếu – scaning). Bên cạnh đó, Tổng cục Thống kê từng bước ứng dụng phiếu điều tra điện tử CAPI cho các cuộc điều tra khác: Lao động việc làm, Biến động dân số, Chỉ số giá tiêu dùng.

Ba là điều hành tác nghiệp và giám sát điều tra: Các cuộc Tổng điều tra và điều tra áp dụng phiếu điện tử đã được giám sát tập trung từ Trung ương tới địa phương và các đối tượng tham gia điều tra nhằm giám sát số liệu điều tra một cách kịp thời và giải đáp các vướng mắc trong quá trình tổ chức điều tra.

Bốn là triển khai các phần mềm thu thập thông tin điều tra phiếu giấy và xử lý kết quả các cuộc điều tra theo hình thức cơ sở dữ liệu tập trung. Nhờ có hạ tầng kết nối thông suốt trong toàn ngành, việc triển khai các phần mềm nghiệp vụ theo hình thức cơ sở dữ liệu tập trung đã cải thiện tình trạng nghẽn trong gửi, nhận dữ liệu. Qua đó, số liệu điều tra được giám sát liên tục từ Trung ương đến địa phương ngay trong khâu nhập tin. Các phần mềm xử lý kết quả điều tra cũng từng bước được tích hợp theo nghiệp vụ chung để chia sẻ các tiện ích dùng chung và quản trị dễ dàng.

Năm là sử dụng dữ liệu lớn: Trong xu hướng sử dụng dữ liệu lớn (big data) trên thế giới, Tổng cục Thống kê đã triển khai nghiên cứu dữ liệu lớn trong biên soạn chỉ số giá tiêu dùng thông qua thu thập giá sản phẩm trên internet và nghiên cứu giá bất động sản. Tuy nhiên, kết quả nghiên cứu mới chỉ được dùng như nguồn tham khảo và tiếp tục đổi mới phương pháp luận để có được kết quả sát với thực tế.

Sáu là xây dựng kho cơ sở dữ liệu các cuộc Tổng điều tra và các phần mềm khai thác dữ liệu vi mô. Một số kho dữ liệu trên nền tảng MS SQL gồm: kết quả Tổng điều tra dân số và nhà ở các năm 1999, 2009; Tổng điều tra cơ sở kinh tế, hành chính sự nghiệp các năm 2007, 2012; Tổng điều tra nông thôn, nông nghiệp và thủy sản các năm 2006, 2011, 2016; Khảo sát mức sống dân cư, Điều tra Lao động việc làm.

Bảy là phổ biến thông tin thống kê trực quan (infographic) như báo cáo tình hình kinh tế - xã hội và khai thác dữ liệu thống kê một cách tùy biến đối với một số kết quả điều tra trên trang tin điện tử của Tổng cục.

1.2. Ứng dụng CNTT trong chia sẻ dữ liệu với các bộ, ngành

Trong thời gian qua, Tổng cục Thống kê đã ký thỏa thuận hợp tác chia sẻ dữ liệu với nhiều bộ, ngành trong đó Bộ Tài chính, Bộ Nông nghiệp và Phát triển nông thôn, Bộ Y tế, Ủy ban Dân tộc, Tổng cục Thuế, Tổng cục Hải quan…Ứng dụng CNTT trong chia sẻ dữ liệu với bộ ngành sẽ mang lại hiểu quả cao, đến nay năng lực hệ thống CNTT đã hỗ trợ thực hiện như sau:

a) Sử dụng dữ liệu hành chính trong công tác thống kê

Ngày 26/5/2016 Bộ trưởng Bộ Kế hoạch và Đầu tư ký Quyết định số 693/QĐ-BKHĐT phê duyệt Đề án hệ thống công nghệ thông tin về kết nối, trao đổi thông tin với Tổng cục Thuế. Đến nay, hai cơ quan đã xây dựng hạ tầng công nghệ thông tin, kết nối truyền đưa dữ liệu một cách tự động. Đồng thời, Tổng cục Thống kê đã và đang triển khai xây dựng và khai thác CSDL nhận được từ Tổng cục Thuế phục vụ cho công tác thống kê nói chung và điều tra doanh nghiệp hàng năm nói riêng:

 

- Thông tin định danh về đối tượng nộp thuế do Tổng cục Thuế cung cấp được Tổng cục Thống kê sử dụng hiệu quả, đặc biệt trong Tổng điều tra kinh tế năm 2017, điều tra doanh nghiệp hàng năm trong khâu rà soát danh sách doanh nghiệp để từ đó xác định và thống nhất với cơ quan Thuế về phạm vi và đơn vị điều tra đối với khu vực doanh nghiệp.

- Thông tin khai thác từ báo cáo tài chính được sử dụng để so sánh, đối chiếu, làm sạch dữ liệu của Điều tra doanh nghiệp hàng năm. Từ năm 2018 nguồn dữ liệu này được Tổng cục Thống kê sử dụng để thay thế một số chỉ tiêu về tài chính, bảng tổng kết tài sản,… của doanh nghiệp trong phiếu điều tra doanh nghiệp hàng năm, từ đó giúp tiết kiệm được thời gian thu thập, xử lý và kinh phí của điều tra doanh nghiệp và giảm gánh nặng trả lời bảng hỏi điều tra cho doanh nghiệp.

Hệ thống kết nối, trao đổi thông tin này được xây dựng theo trục tích hợp ESB để Tổng cục Thống kê tiến tới mở rộng kết nối với các bộ, ngành.

b) Thực hiện chế độ báo cáo quốc gia

Triển khai Nghị định số 60/2018/NĐ-CP ngày 20/4/2018 của Chính phủ quy định chi tiết nội dung Chế độ báo cáo thống kê cấp quốc gia, Tổng cục Thống kê đã xây dựng phần mềm gửi nhận Chế độ báo cáo thống kê cấp quốc gia quản lý tình hình gửi nhận báo cáo từ bộ, ngành. Đây là công cụ giúp bộ, ngành thực hiện trách nhiệm gửi báo cáo thống kê được phân công qua đó lưu trữ bài bản báo cáo thống kê mỗi bộ ngành theo thời gian. Hệ thống đã được các bộ, ngành thử nghiệm và đánh giá rất hữu ích. Hệ thống đi vào áp dụng chính thức sẽ giúp ngành Thống kê quản lý tình hình gửi nhận báo cáo và nhận báo cáo thống kê kịp thời.

c) Chia sẻ dữ liệu thống kê với bộ, ngành

Bên cạnh việc nhận dữ liệu của bộ, ngành, Tổng cục Thống kê cũng chủ động chia sẻ dữ liệu thống kê với các bộ, ngành phục công tác xây dựng và hoạch định chính sách:

- Tại hệ thống công nghệ thông tin về kết nối, trao đổi thông tin với Tổng cục Thuế, tất cả chỉ tiêu thống kê quốc gia được quản lý tập chung và định kỳ gửi cho Tổng cục Thuế sau khi họp báo công bố số liệu thống kê;

- Các dữ liệu thống kê được công bố trên trang tin điện tử của Tổng cục theo báo cáo chuyên đề và dữ liệu tổng hợp đồng thời cho phép khai thác dữ liệu thống kê một cách tùy biến bằng công cụ PCX hoặc một số kho dữ liệu về Tổng điều tra;

- Tổng cục Thống kê phối hợp với Bộ Tài chính xây dựng Trang dữ liệu tóm tắt quốc gia (NSDP) chia sẻ số liệu về tài chính và kinh tế vĩ mô theo các định dạng Excel và SDML đồng thời cung cấp thông tin về metadata liên quan.

2. Một số hạn chế, bất cập

 

Tổng cục Thống kê là một trong các cơ quan tiên phong xây dựng Kiến trúc tổng thể, trong đó kiến trúc nghiệp vụ ứng dụng quy trình sản xuất thông tin thống kê năm 2012 bao gồm 7 bước ở quy trình cấp cao. Hiện nay, hầu hết các khâu của quy trình sản xuất thông tin thống kê đã ứng dụng công nghệ thông tin nhưng chưa đồng bộ, mỗi khâu của mỗi công việc ứng dụng theo một cách khác nhau. Hiện chưa có một ứng dụng đồng bộ nào cho toàn bộ quy trình sản xuất. Do vậy, hiện trạng dữ liệu thống kê hiện cũng được quản lý theo nhiều hệ quản trị dữ liệu và phân tán khắp nơi trong ngành Thống kê từ Trung ương đến địa phương (bao gồm cả một số dữ liệu đã tập trung về Trung ương nhưng vẫn chưa thống nhất, thiếu tính liên kết theo không gian và thời gian). Cụ thể:

(i) Khâu xác định nhu cầu thông tin và khâu chuẩn bị thu thập: Chưa có một công cụ hỗ trợ nào, hầu như thực hiện thủ công trên word và excel.

(ii) Khâu chuẩn bị thu thập: Cũng như khâu xác định nhu cầu hiện đang thực hiện thủ công.

(iii) Khâu thu thập thông tin: Kênh điều tra thống kê đã được ứng dụng CNTT theo kịp xu thế công nghệ trên thế giới và đang từng bước chuyển đổi từ phiếu giấy (phương pháp nhập tin bàn phím và ứng dụng công nghệ quét - scaning) sang phiếu điều tra điện tử. Tuy nhiên, mỗi cuộc điều tra, mỗi kỳ điều tra ứng dụng khác nhau, rất nhỏ lẻ, phân tán, thiếu thống nhất. Kênh báo cáo thống kê và khai thác dữ liệu hành chính mới chỉ bước đầu ứng dụng công nghệ thông tin hiện đã kết nối sử dụng dữ liệu quản lý thuế và thu nhận báo cáo từ các bộ, ngành thông qua ứng dụng.

(iv) Khâu tổng hợp thông tin: Tổng hợp dữ liệu điều tra đã được thực hiện trực tiếp trên các phần mềm xử lý kết quả cuộc điều tra riêng lẻ. Tuy nhiên, việc sử dụng dữ liệu giữa các cuộc điều tra còn thực hiện thủ công mất nhiều công sức, cụ thể như các phần mềm tổng hợp kết quả trung gian: phần mềm tính giá trị sản xuất, phần mềm tổng hợp dữ liệu thống kê tổng hợp.

(v) Khâu phân tích thống kê: Một số ít chỉ tiêu thống kê được thực hiện phân tích bằng phần mềm SPSS, SATA, còn nhiều chỉ tiêu chưa ứng dụng một phần mềm chuyên nghiệp nào. Một số báo cáo phân tích đã phát hành chủ yếu sử dụng công cụ của bộ phần mềm văn phòng theo ngẫu hứng, chưa có quy chuẩn phân tích thống nhất.

(vi) Khâu phổ biến thông tin thống kê: Thông tin thống kê được phổ biến kịp thời và trực quan trên trang tin điện tử của Tổng cục. Tuy nhiên, nội dung chưa phong phú, công cụ hỗ trợ khai thác thông tin còn yếu, thông tin tĩnh, chưa biểu diễn được thông tin phổ biến ra dưới dạng hình ảnh, thông tin chưa gắn được với bản đồ địa lý.

 

(vii) Khâu lưu trữ thông tin: Dữ liệu thống kê, nhất là dữ liệu vi mô được lưu trữ rất phân tán, thiếu liên kết giữa số liệu tổng hợp với dữ liệu vi mô, giữa các lĩnh vực, kể cả cùng lĩnh vực nhưng khó liên kết theo thời gian.

Ngoài ra, công việc chỉ đạo điều hành quá trình sản xuất thông tin thống kê đã từng bước được áp dụng ở một số cuộc Tổng điều tra và điều tra thống kê sử dụng phiếu điện tử nhưng vẫn được quản lý trên các ứng dụng riêng rẽ.

- Cơ sở dữ liệu thống kê và metadata:

+ Hiện nay đã hình thành CSDL metadata của Ngành để sử dụng chung với một số dữ liệu về các bảng danh mục; ngân hàng câu hỏi điều tra; các bảng mã câu trả lời cho câu hỏi đóng đối với một số lĩnh vực thống kê.

+ Một số cơ sở dữ liệu được quản lý tập trung tại trung tâm máy chủ Tổng cục, còn lại hầu hết dữ liệu đang được quản lý phân tán tại các máy lẻ của các công chức Vụ nghiệp vụ, các phòng nghiệp vụ Cục Thống kê, thậm chí cả ở Chi Cục Thống kê. Ngoài ra, do nghiệp vụ thường xuyên cải tiến nên phần mềm phải sửa chữa, cập nhật nhiều, đặc biệt là dữ liệu rất khó kết nối, xâu chuỗi theo thời gian và giữa các lĩnh vực. Cũng chính vì vậy, CSDL metadata mặc dù đã hình thành nhưng chưa thể đầy đủ, chưa thể hoàn thiện để làm cơ sở thống nhất đồng bộ dữ liệu.

3. Kế hoạch Ứng dụng CNTT giai đoạn 2020-2025

Triển khai Đề án 501, Tổng cục Thống kê đã xây dựng các hồ sơ dự án hỗ trợ điều tra thống kê và chia sẻ dữ liệu với các bộ, ngành thực hiện trong giai đoạn 2020-2025, với các nội dung cụ thể:

- Xây dựng trung tâm dữ liệu đầu vào: hình thành trung tâm dữ liệu đầu vào tập trung thống nhất trên cơ sở chuẩn hóa nghiệp vụ và công nghệ sử dụng. Tích hợp tất cả dữ liệu từ các nguồn điều tra, nguồn dữ liệu hành chính, từ nguồn chế độ báo cáo định kỳ và từ nguồn dữ liệu lớn;

- Xây dựng cơ sở dữ liệu đặc tả thống kê (metadata) đáp ứng yêu cầu về chuẩn hóa dữ liệu. Metadata mô tả dữ liệu thống kê bao gồm các dữ liệu đặc tả của các cuộc điều tra trong các đơn vị, ngân hàng câu hỏi điều tra và bộ dữ liệu mô tả thống kê. Metadata về cấu trúc Cơ sở dữ liệu gồm mô tả cơ sở dữ liệu, thông tin các trường dữ liệu và luật logic thể hiện mối quan hệ giữa các trường dữ liệu. Dữ liệu danh mục dùng chung: các danh mục, dữ liệu dùng chung được quản lý tập trung và sử dụng chung giữa các ứng dụng.

- Xây dựng Hệ thống công nghệ thông tin phục vụ Tổng điều tra kinh tế năm 2021 đồng bộ thống nhất, gồm bốn hạng mục chính: (i) Hệ thống thu thập thông tin điều tra CAPI, webform[1] và giám sát điều tra; (ii) Hệ thống tiếp nhận, chuẩn hoá, xử lý dữ liệu điều tra; (iii) Hệ thống Cơ sở dữ liệu tập trung để lưu trữ, khai thác và báo cáo thông kê, (iv) Hệ thống công bố thông tin.

 

- Xây dựng Hệ thống công nghệ thông tin phục vụ hỗ trợ các công đoạn của Tổng điều tra nông thôn, nông nghiệp và thủy sản năm 2025 từ khâu thu thập thông tin; xử lý, phân tích thông tin và phổ biến thông tin Tổng điều tra. Sử dụng phiếu điều tra điện tử trên 80% đối với đối tượng là hộ gia đình và trang trại, 100% đối với các đối tượng là doanh nghiệp và UBND xã, phường.

- Từng bước xây dựng các phần mềm CAPI và webform cho các điều tra hàng năm trong khâu thu thập thông tin điều tra.

- Xây dựng kho dữ liệu vi mô thống kê phải đảm bảo được các yêu cầu cơ bản: Chuẩn hoá hệ thống chỉ tiêu, dữ liệu theo các kỳ điều tra và hệ thống chủ đề dữ liệu thống nhất, các thông tin danh mục dùng chung; Có khả năng trích lọc, chuyển đổi, kết xuất, tích hợp dữ liệu từ các CSDL chuyên ngành của các đơn vị (nếu có) vào kho dữ liệu vi mô thống kê, cung cấp các công cụ thống kê, phân tích, dự báo liên quan đến các lĩnh vực kinh tế - xã hội để hỗ trợ ra quyết định, xuất bản thông tin. Hỗ trợ trình bày hình ảnh hóa dữ liệu (GIS) sau khi người dùng trích xuất.

- Xây dựng hệ thống kết nối, trao đổi thông tin với Chính phủ và các bộ, ngành tạo môi trường kết nối liên thông để gửi, nhận thông tin, dữ liệu hành chính phục vụ nghiệp vụ sản xuất số liệu thống kê, trao đổi kết quả phổ biến thông tin thống kê giữa Tổng cục Thống kê với Chính phủ và các bộ, ngành. Hệ thống sử dụng nền tảng trục tích hợp dùng chung ESB của Chính phủ điện tử. Các dịch vụ này được tích hợp, vận hành, quản lý tập trung bởi hệ thống quản lý nền tảng trục tích hợp, phục vụ chung cho toàn bộ hệ thống các ứng dụng, CSDL khác bên trong và bên ngoài Tổng cục Thống kê.

- Xây dựng Cổng phổ biến thông tin thống kê công bố các số liệu báo cáo kinh tế - xã hội và dữ liệu thống kê của các cuộc điều tra, thuộc tất cả các lĩnh vực thống kê chuyên ngành theo nhiều hình thức hiển thị, khai thác. Cụ thể là ứng dụng hình ảnh hóa trực quan (infographic và visualization) và khai thác dữ liệu thống kê tùy biến theo phân quyền.

4. Một số yêu cầu về nghiệp vụ

Việc thực hiện chuẩn hóa quy trình, quy định nghiệp vụ cần tiến hành song song và hoàn thành trước khi thực hiện các dự án ứng dụng CNTT trong lĩnh vực thống kê. Các chuẩn mực này sẽ được công bố và áp dụng cho các dự án trong và ngoài ngành Thống kê nhằm đảm bảo khả năng tích hợp thông tin trong quá trình xây cơ sở dữ liệu thống kê quốc gia tập trung là thành phần cốt lõi của hệ thống thông tin thống kê quốc gia.

Chủ trương của Tổng cục trong thời tới sẽ chuyển dần các điều tra hiện nay sang ứng dụng CAPI và webform. Vì vậy, việc thiết kế phiếu điều tra cũng cần thay đổi cách tiếp cận từ phiếu giấy sang phiếu điện tử là người cung cấp thông tin sẽ trả lời lần lượt câu hỏi, bảng hỏi cần tránh các bảng biểu phức tạp nhất có thể. Cục Thống kê và Chi cục Thống kê cần chủ động trong việc tuyển chọn điều tra cần có điện thoại thông minh hoặc máy tính bảng tham gia. Để nâng cao tỷ lệ cung cấp thông tin qua webform thì đòi hỏi công việc tuyên truyền từ cấp Trung ương tới địa phương cần vào cuộc thực hiện một cách sâu rộng./.

theo https://gso.gov.vn/ItemPreview.aspx?ItemID=19477


Tin xem nhiều

placeholder image

Các câu hỏi để kiểm tra mức độ an toàn khi chia sẻ dữ liệu