angle-left null Đặc điểm và giải pháp xây dựng QCVN 109
Trang chủ

21/05/2020 07:10

(data.gov.vn) Cấu trúc thông điệp trao đổi dữ liệu dân cư chỉ phục vụ cho việc trao đổi dữ liệu giữa các hệ thống thông tin với CSDLQG về dân cư

Cấu trúc thông điệp trao đổi dữ liệu dân cư chỉ phục vụ cho việc trao đổi dữ liệu giữa các hệ thống thông tin với CSDLQG về dân cư

Khác với lược đồ cấu trúc dữ liệu, mục đích chủ yếu của lược đồ trao đổi dữ liệu là mô tả cấu trúc của thông điệp dữ liệu được trao đổi giữa các hệ thống thông tin thay vì thể hiện cấu trúc của dữ liệu lưu giữ bên trong một hệ thống thông tin. Lược đồ cấu trúc dữ liệu mô tả tổng thể cấu trúc dữ liệu của cơ sở dữ liệu quan hệ, phục vụ lưu trữ dữ liệu với khối lượng lớn và phạm vi dữ liệu tương đối toàn vẹn, giúp tối ưu việc lưu trữ, tìm kiếm, truy vấn dữ liệu. Lược đồ trao đổi dữ liệu tập trung việc trao đổi thông điệp dữ liệu bằng cách cho phép mô tả cấu trúc dữ liệu tùy thuộc vào ngữ cảnh, nhu cầu trao đổi để thể hiện được nhiều nội dung trao đổi với mục đích và phạm vi khác nhau.

Phù hợp với quy định của pháp luật về nội dung thông tin

Điều 6, Nghị định số 90/2010/NĐ-CP ngày 18/8/2010 quy định về CSDLQG về Dân cư quy định: thông tin của công dân được thu thập trong CSDLQG về Dân cư gồm 22 mục tin. Tuy nhiên, Luật Căn cước công dân số 59/2014/QH13 quy định: nội dung thông tin gồm 15 mục tin (Điều 9). Vì vậy, lược đồ dữ liệu dân cư phải được thiết kế theo quy định tại Luật Căn cước công dân. Trong thời gian tới, Nghị định số 90/2010/NĐ-CP cũng sẽ được điều chỉnh để phù hợp với nội dung trong Luật Căn cước công dân. Do Luật Căn cước công dân đã quy định cụ thể 15 mục tin của công dân, nên lược đồ trao đổi dữ liệu dân cư cần thể hiện đầy đủ 15 mục tin này, việc bổ sung hoặc bớt mục tin là không cần thiết và không có căn cứ.

Đáp ứng các nhu cầu, ràng buộc cơ bản về thu thập dữ liệu dân cư

Trong thực tế, đối với mỗi công dân, việc thu thập dữ liệu của 15 mục tin có thể không hoàn chỉnh do nhiều yếu tố như: điều kiện thu thập; độ chính xác thông tin; nguồn cung cấp các dữ liệu hạn chế. Vì vậy, khi xây dựng lược đồ trao đổi dữ liệu dân cư cần phản ánh các tình huống sau: không có/chưa có thông tin đối với các mục tin đã thu thập và trao đổi (chia sẻ thông tin nhưng thông tin chưa xác định); có thông tin nhưng thông tin không được trao đổi do hạn chế theo thẩm quyền trao đổi, khai thác; mục tin không đầy đủ (địa chỉ mô tả một cách chung chung, không thể chuẩn hóa qua đơn vị hành chính; ngày, tháng, năm không đủ cấu phần. Ví dụ: không thể xác định được ngày, hoặc ngày tháng sinh/tử, chỉ có thông tin năm sinh/tử).

Khả năng tương thích với cơ sở dữ liệu hiện có và chuẩn hóa các giá trị dữ liệu thông dụng

Để tương thích với các cơ sở dữ liệu hiện có, đồng thời tránh nhầm lẫn khi khai thác các thông tin trao đổi giữa các bên, các giá trị thuộc tính dữ liệu cần được mã hóa theo các giá trị được sử dụng phổ biến nhất. Theo đó, các thông tin thuộc tính của công dân liên quan đến các danh mục cần được mã hóa trên cơ sở các danh mục mã dùng chung theo quy định của pháp luật cũng như danh mục mã thông dụng trong nước và quốc tế.

Phương pháp mô tả được sử dụng

Ngày 26/12/2014, Bộ Thông tin và Truyền thông đã có văn bản số 3788/BTTTT-THH hướng dẫn liên thông, trao đổi dữ liệu có cấu trúc bằng ngôn ngữ XML giữa các hệ thống thông tin trong cơ quan nhà nước. Văn bản này khuyến nghị đối với mỗi chủ đề dữ liệu trao đổi, cần xây dựng lược đồ trao đổi XML Schema (viết tắt là XSD) tương ứng, công bố rộng rãi để thống nhất sử dụng. Do vậy, lược đồ trao đổi dữ liệu dân cư cũng cần sử dụng XSD làm ngôn ngữ mô tả lược đồ.

Lược đồ XSD cho phép thể hiện dữ liệu trao đổi dưới dạng mã (thuộc mô hình lớp vật lý tương đương với lược đồ cấu trúc các bảng trong cơ sở dữ liệu quan hệ). Tuy nhiên, con người thường khó đọc và hiểu dữ liệu dưới dạng các dạng mã hóa này. Vì thế, để mô tả rõ và mang tính tổng quát hơn, ta cần thêm vào mô hình dữ liệu các mức khái niệm, mức logic và thể hiện chúng dưới dạng ngôn ngữ UML (là ngôn ngữ thông dụng trong thiết kế hệ thống thông tin). Đối với trường hợp trao đổi dữ liệu dân cư, mô hình dữ liệu đơn giản và ít thông tin nên mô hình dữ liệu UML dưới dạng khái niệm và logic có thể được gộp chung với nhau.

Thống nhất cấu trúc thông tin có chung đặc điểm mô tả, phạm vi sử dụng

Một số thông tin mô tả thuộc tính của công dân có các đặc điểm giống nhau như: các cá nhân liên quan (cha, mẹ, vợ, chồng, người đại diện), các thông tin mô tả địa chỉ (nơi đăng ký khai sinh, quê quán, nơi thường trú, nơi ở hiện tại)… cần được mô tả bằng một cấu trúc thông tin chung trong lược đồ để dễ dàng mã hóa cũng như xử lý dữ liệu trao đổi.

Các mục thông tin có điều kiện cũng được xây dựng thành kiểu dữ liệu kế thừa từ các kiểu dữ liệu cơ bản trong ngôn ngữ mô tả lược đồ XML Schema tiêu chuẩn bổ sung các ràng buộc như giới hạn độ dài và chỉ chứa ký tự số: Số định danh (chuỗi ký tự chỉ chứa số giới hạn 12 chữ số), số chứng minh nhân dân (chuỗi ký tự 9 hoặc 12 chữ số) hay chấp nhận theo danh sách cho trước: quan hệ (cha, mẹ, vợ, chồng…), tình trạng hôn nhân (độc thân, kết hôn, ly hôn…), nhóm máu (A, B, AB, O…) để đảm bảo hiểu thống nhất, giảm sai lệch dữ liệu.

Giải quyết vấn đề sử dụng cho trao đổi với thông điệp dữ liệu đa dạng về phạm vi và nội dung

 

Thực tế việc trao đổi dữ liệu dân cư thường bị ràng buộc bởi thẩm quyền khai thác, sử dụng, nên đa phần các mục tin trong lược đồ trao đổi dữ liệu dân cư đều ở dạng lựa chọn. Nghĩa là mục tin này có thể xuất hiện hoặc không xuất hiện trong thông điệp dữ liệu dân cư tùy theo trường hợp được khai thác. Số định danh, họ và tên, giới tính là các mục tin bắt buộc phải có trong mọi thông điệp dữ liệu dân cư. Điều này tạo điều kiện thuận lợi cho việc triển khai thực tế phù hợp với các chính sách phân phối và khai thác thông tin dân cư khác nhau, đảm bảo các yếu tố về bảo mật thông tin cá nhân.

Như vậy, với các hạng mục tin không được chia sẻ thì không xuất hiện trong thông điệp dữ liệu dân cư. Đối với với mục tin chưa xác định trong thực tế thì mục tin vẫn xuất hiện trong thông điệp dữ liệu, tuy nhiên, dữ liệu cần thể hiện rõ thông tin này chưa được xác định.

Vấn đề về đáp ứng dữ liệu đa dạng theo thực tế

Ở đây xem xét hai loại kiểu thông tin gồm: thông tin về địa chỉ và thông tin về thời gian. Thông tin về địa chỉ thể hiện: nơi đăng ký khai sinh; quê quán; thường trú; nơi ở hiện tại. Để thuận lợi cho việc xử lý, thông tin về địa chỉ cần được mã hóa bởi theo tên các cấp hành chính xã, huyện, tỉnh đã chuẩn hóa. Tuy nhiên, do đặc điểm tổ chức khác nhau theo vùng miền, sự biến động về tên gọi theo thời gian hay tồn tại nhiều tên gọi khác nhau mà một số tình huống không thể xác định cấp hành chính ghi trong địa chỉ phù hợp hoặc cần làm rõ hơn thông tin ngoài đơn vị hành chính. Giải pháp lưu thông tin địa chỉ cần một mã số đơn vị hành chính và một địa chỉ mô tả có thể chấp nhận được. Thông tin mô tả được bổ sung, sử dụng những khi mã đơn vị hành chính không xác định hoặc có thông tin chi tiết hơn được thu thập. Mã đơn vị hành chính được thực hiện theo Quyết định số 124/2004/QĐ-TTg ngày 08/7/2004 của Thủ tướng Chính phủ về việc ban hành bảng Danh mục và mã số các đơn vị  hành chính Việt Nam và các thông tin sửa đổi được cập nhật bởi Tổng cục Thống kê, Bộ Kế hoạch và Đầu tư là phù hợp, không bị thay đổi trong quá trình chia tách các đơn vị hành chính. Một mã duy nhất với độ dài khác nhau (2, 3, 5 chữ số) sẽ thể hiện được mức độ chính xác thông tin của người dân thu thập được; cấp xã, huyện luôn có thể xác định được cấp cao hơn (cấp huyện, tỉnh) theo hệ thống bảng mã này.

Thông tin về thời gian thể hiện thời gian sinh, chết hoặc mất tích. Thực tế, thông tin mỗi công dân hoàn toàn có thể không ghi nhận được thông tin chính xác giờ, ngày, tháng. Có thể áp dụng một số giải pháp sau: Lưu trường thông tin thời gian đầy đủ (ngày, tháng, năm, giờ, phút, giây) kèm theo một trường thông tin về năm. Phương án này được áp dụng phù hợp với các trường hợp thông dụng thực tế các thông tin được ghi nhận nếu không có ngày tháng, năm đầy đủ sẽ chỉ ghi nhận năm (sinh, chết, mất tích); Lưu thông tin riêng rẽ về ngày, tháng, năm, giờ, phút để ghi nhận từng giá trị riêng biệt có mức độ linh động nhất định.

theo http://qcvn109.gov.vn/tin-tuc/dac-diem-va-giai-phap-xay-dung-qcvn-109.html


Tin xem nhiều

placeholder image

Các câu hỏi để kiểm tra mức độ an toàn khi chia sẻ dữ liệu