angle-left null Quản lý dữ liệu và các nguyên tắc quản lý dữ liệu tốt
Trang chủ

10/12/2020 09:59

(data.gov.vn) Quản lý dữ liệu là nội dung công việc cần phải thực hiện của bất kỳ cơ quan, tổ chức nào có xây dựng và quản lý dữ liệu dù là cơ quan nhà nước hay doanh nghiệp. Quản lý dữ liệu bao gồm các công việc gì và làm thế nào để quản lý dữ liệu tốt. Cùng nghiên cứu, tham khảo các nội dung quản lý dữ liệu và khuyến nghị quản lý dữ liệu của Chính phủ Anh. Tuy khuyến nghị được ban hành áp dụng cho dữ liệu không gian địa lý nhưng cũng theo như khuyến cáo các nguyên tắc này cũng có thể được áp dụng cho các loại dữ liệu khác.

  1. Quản lý dữ liệu là gì?

Quản lý dữ liệu là một tập hợp các hoạt động liên quan đến việc lập kế hoạch, phát triển, thực hiện và quản trị các hệ thống để thu thập, lưu trữ, bảo mật, truy xuất, phổ biến, lưu trữ và xử lý dữ liệu. Các hệ thống như vậy thường là kỹ thuật số, nhưng thuật ngữ này cũng áp dụng cho các hệ thống dựa trên giấy tờ nơi thuật ngữ quản lý hồ sơ thường được sử dụng. Thuật ngữ này bao hàm tất cả các dạng dữ liệu, cho dù dữ liệu này là dạng giấy, cơ sở dữ liệu quan hệ hay dữ liệu đa phương tiện như hình ảnh, hoặc dữ liệu nghiên cứu khoa học.

Việc quản lý dữ liệu địa lý về nhiều mặt không khác với việc quản lý các loại dữ liệu khác. Các hoạt động chính quản lý dữ liệu bao gồm:

• Phát triển chính sách dữ liệu.

• Quyền sở hữu dữ liệu.

• Tổng hợp siêu dữ liệu.

• Kiểm soát vòng đời dữ liệu.

• Chất lượng dữ liệu.

• Truy cập, phổ biến, chia sẻ dữ liệu.

  1. Vai trò của quản lý dữ liệu

Chính phủ sở hữu một lượng lớn dữ liệu thông tin địa lý để phục vụ hoạt động quản lý nhà nước và không thể thay thế bởi các nguồn dữ liệu khác, dữ liệu địa lý có đóng vai trò quan trọng trong sử dụng chung cho nhiều ngành, lĩnh vực khác nhau. Điều này đòi hỏi phải có khả năng quản lý, duy trì và chia sẻ tốt. Vì vậy, vai trò của quản lý dữ liệu là rất quan trọng. Quản lý dữ liệu giúp:

• Tăng cường hiệu quả của dữ liệu đã được xây dựng. Dữ liệu được thu thập bằng chi phí nhà nước nên phải phải được quản lý thích hợp để phát huy hết tiềm năng của dữ liệu, để tối đa hóa chi phí sản xuất và duy trì hoạt động của dữ liệu.

• Khả năng tương tác giữa các hệ thống thông tin và dịch vụ công trong cơ quan chính phủ. Đầu ra và độ tin cậy của các dịch vụ đó phụ thuộc nhiều vào chất lượng của dữ liệu được cung cấp. Khi số lượng các dịch vụ công có thể tương tác tăng lên, thì yêu cầu phải có quyền truy cập sẵn sàng vào dữ liệu có chất lượng.

• Chính phủ nhấn mạnh hơn nữa nhu cầu hợp lý hóa và kết hợp dữ liệu để nâng cao hiệu quả và gia tăng giá trị của dữ liệu.

Kiểm soát chặt chẽ hơn việc sử dụng dữ liệu để bảo vệ Quyền sở hữu trí tuệ (IPR) và tính bảo mật của dữ liệu nhạy cảm.

  1. Lợi ích của quản lý dữ liệu tốt

Các chính sách và thủ tục quản lý dữ liệu đảm bảo rằng dữ liệu trên tất cả các phương tiện được coi như một tài nguyên có giá trị. Thực hiện các chính sách và thủ tục như vậy sẽ mang lại nhiều lợi ích:

Lợi ích đối với cơ quan cung cấp dữ liệu

• Tăng cường sự tự tin và tin cậy rằng dữ liệu sẽ được sử dụng theo các điều kiện sử dụng đã thỏa thuận, không có rủi ro về bảo mật, bản quyền sở hữu trí tuệ và tuân thủ tất cả các nghĩa vụ theo luật định và các nghĩa vụ khác.

• Cung cấp hiểu biết rõ ràng về việc sử dụng dữ liệu, được chính thức lập thành văn bản trong Biên bản thỏa thuận chia sẻ dữ liệu được ký bởi cả nhà cung cấp và người dùng.

Hồi đáp hợp lý cho việc sử dụng dữ liệu họ đã cung cấp.

Lợi ích đối với đơn vị trung gian chia sẻ dữ liệu

• Chất lượng tốt hơn, dữ liệu hài hòa và mạch lạc từ việc sử dụng các định nghĩa chung, bao gồm các chỉ dẫn tham chiếu địa lý, định dạng, quy trình xác nhận và quy trình chuẩn.

• Chăm sóc người sử dụng tốt hơn việc nắm giữ dữ liệu thông qua việc sử dụng các chính sách dữ liệu hiệu quả và hướng dẫn thực hành tốt nhất.

• Kiểm soát dữ liệu tốt hơn bằng cách xác định rõ ràng và sử dụng các thủ tục để quản lý dữ liệu.

• Nâng cao kiến ​​thức và hiểu biết về việc nắm giữ dữ liệu, tính sẵn có, tính khả dụng và sử dụng chúng, giảm nguy cơ trùng lặp hoặc mất mát, thông qua việc lập danh mục tốt hơn, siêu dữ liệu và truy cập kịp thời vào dữ liệu thông qua môi trường dữ liệu tích hợp.

• Các quy trình nghiệp vụ được cải tiến, bao gồm việc sử dụng và tái sử dụng dữ liệu tốt hơn và hiệu quả hơn cũng như tiêu chuẩn hóa các bộ dữ liệu thường được các bộ phận khác nhau của tổ chức sử dụng.

• Tăng cường sự tin tưởng rằng tổ chức tuân thủ các nghĩa vụ theo luật định và nghĩa vụ khác, bằng cách sử dụng thường xuyên các hướng dẫn được điều phối tập trung, cập nhật thường xuyên, các quy tắc thực hành và đào tạo về các nghĩa vụ pháp lý, hợp đồng và các nghĩa vụ khác.

• Kiểm soát tốt hơn quyền truy cập vào dữ liệu, cho cả người dùng nội bộ và bên ngoài, tổ chức và bảo trì dữ liệu tốt hơn tuân theo các chính sách đã xác định về phát hành, kiểm soát, tiết lộ và bảo mật dữ liệu.

• Chi phí và điều kiện sử dụng dữ liệu hợp lý và nhất quán hơn, do các chính sách định giá và phổ biến rõ ràng nhận thấy nhu cầu truy cập miễn phí của các khách hàng thích hợp đồng thời thu hồi thu nhập thích hợp từ những khách hàng tìm cách kiếm lợi thương mại.

• Khách hàng ngày càng tin tưởng vào chất lượng dữ liệu được quản lý và độ tin cậy của kết quả đầu ra được tạo ra.

Lợi ích cho người dùng

• Nâng cao nhận thức và hiểu biết về những dữ liệu nào có sẵn để sử dụng hiện tại và tương lai, nhờ vào việc lập danh mục và lưu trữ dữ liệu tốt hơn.

• Cải thiện quyền truy cập vào dữ liệu, không gặp phải những trở ngại không cần thiết, được bảo vệ khỏi việc tiết lộ thông tin cá nhân hoặc vi phạm các nghĩa vụ pháp lý và hợp đồng.

• Chất lượng tốt hơn và thông tin kịp thời hơn tức là truy cập đúng thông tin vào đúng thời điểm, nhờ vào việc xác định nhanh hơn nhu cầu của người sủ dụng và tránh thông tin sai hoặc mâu thuẫn thông qua việc sử dụng siêu dữ liệu hiệu quả.

• Giá trị cao hơn nhờ các điều kiện và phí sử dụng dữ liệu rõ ràng, hợp lý và nhất quán, truy cập miễn phí của đối với các dữ liệu thích hợp.

• Khai thác dữ liệu tốt hơn, được kích hoạt bằng cách trao đổi dữ liệu dễ dàng hơn và tích hợp với dữ liệu khác.

• Hiệu quả đạt được giữa chính phủ và các cơ quan của chính phủ do sử dụng dữ liệu chất lượng tốt hơn.

  1. Nguyên tắc quản lý dữ liệu tốt

Quản lý dữ liệu tốt là điều cần thiết để sử dụng hiệu quả các nguồn thông tin của các cơ quan công quyền dưới mọi hình thức. Các hoạt động Quản lý dữ liệu chính:

 

  1. Tránh thu thập lại dữ liệu

Khả năng lãng phí lớn nhất trong quản lý dữ liệu là xây dựng lại một tập dữ liệu hiện có. Điều này phải tránh lặp lại bởi các tổ chức khu vực công và ngay cả khu vực tư nhân. Ví dụ: tại Hoa Kỳ, Lệnh hành pháp 12906 yêu cầu các cơ quan chính phủ thực hiện các thủ tục nội bộ để đảm bảo rằng họ đã kiểm tra các cơ quan khác đã thu thập thông tin mà họ định thu thập hay chưa.

  1. Kiểm soát vòng đời dữ liệu

Quản lý dữ liệu tốt yêu cầu toàn bộ vòng đời của tập dữ liệu được quản lý cẩn thận. Điu nay bao gồm:

Đảm bảo rằng đã xem xét về lý do tại sao dữ liệu mới được yêu cầu thay vì dữ liệu hiện có được sửa đổi hoặc sử dụng theo cách mới, cách dữ liệu có thể được chỉ định để sử dụng tối đa, bao gồm cả khả năng đáp ứng các yêu cầu có thể có khác và tại sao chi phí của sự kiểm soát, lưu trữ và duy trì những dữ liệu này là phù hợp.

• Đặc tả dữ liệu và mô hình hóa, xử lý, bảo trì và bảo mật cơ sở dữ liệu, để đảm bảo rằng dữ liệu sẽ phù hợp với mục đích sử dụng và được lưu giữ an toàn trong cơ sở dữ liệu.

Tiến hành kiểm tra dữ liệu, để giám sát việc sử dụng và tính hiệu quả liên tục của dữ liệu.

• Lưu trữ và tiêu hủy khi hết hạn sử dụng, để đảm bảo rằng dữ liệu được lưu trữ và duy trì hiệu quả cho đến khi chúng không còn cần thiết hoặc không mang lại giá trị để giữ lại.

     c . Chính sách dữ liệu

Bước cơ bản đối với bất kỳ tổ chức nào muốn thực hiện các quy trình quản lý dữ liệu tốt là xác định các chính sách dữ liệu. Các cơ quan phải ban hành các chính sách về dữ liệu. Chính sách phải là một tập hợp các nguyên tắc cấp cao, rộng tạo thành khung hướng dẫn trong đó các hoạt động quản lý dữ liệu có thể đi vào vận hành.

  1. Quyền sở hữu dữ liệu

Một khía cạnh quan trọng của quản lý dữ liệu tốt là xác định rõ ràng chủ sở hữu của dữ liệu. Thông thường, đây là tổ chức hoặc nhóm tổ chức đã ủy quyền ban đầu cho việc thu thập hoặc biên soạn dữ liệu và giữ quyền kiểm soát về mặt quản lý và tài chính đối với dữ liệu. Chủ sở hữu dữ liệu có các quyền hợp pháp đối với tập dữ liệu, Bản quyền quyền sở hữu trí tuệ.

Quyền sở hữu dữ liệu bao hàm quyền khai thác dữ liệu. Trong trường hợp tiếp tục bảo trì trở nên không cần thiết hoặc không kinh tế, thì quyền tiêu hủy chúng, tuân theo các quy định của các hành vi được quy định tại chính sách Hồ sơ công cộng và Tự do thông tin của Anh. Quyền sở hữu có thể liên quan đến một mục dữ liệu, một tập dữ liệu hoặc một tập dữ liệu giá trị gia tăng. Quyền sở hữu trí tuệ có thể được sở hữu ở các cấp độ khác nhau. Ví dụ: một tổ chức có thể sở hữu tập dữ liệu đã hợp nhất hoặc tập dữ liệu giá trị gia tăng, mặc dù các tổ chức khác sở hữu dữ liệu cấu thành. Nếu quyền sở hữu hợp pháp không rõ ràng, dữ liệu có thể bị khai thác sai, sử dụng mà không trả tiền bản quyền cho chủ sở hữu, bị bỏ quên hoặc bị mất.

Do đó, điều quan trọng là Chủ sở hữu dữ liệu phải thực hiện hành động để thiết lập và ghi lại:

• Quyền sở hữu, quyền sở hữu trí tuệ của dữ liệu để dữ liệu thể được bảo vệ.

• Các nghĩa vụ theo luật định và các quy định khác có liên quan đến hoạt động nghiệp vụ của họ để đảm bảo rằng dữ liệu được tuân thủ.

• Các chính sách về bảo mật dữ liệu, kiểm soát tiết lộ, phát hành, định giá và phổ biến.

• Thỏa thuận đạt được với người dùng về các điều kiện sử dụng trong Biên bản thỏa thuận đã ký, trước khi dữ liệu được phát hành.

  1. Dữ liệu đặc tả (siêu dữ liệu)

Tất cả các tập dữ liệu phải có siêu dữ liệu thích hợp được biên soạn tương ứng. Ở cấp độ đơn giản nhất, siêu dữ liệu là "dữ liệu về dữ liệu". Siêu dữ liệu cung cấp bản tóm tắt các đặc điểm của tập dữ liệu. Bản ghi siêu dữ liệu tốt cho phép người dùng tập dữ liệu hoặc tài nguyên thông tin khác hiểu được nội dung của những gì họ đang xem xét, giá trị tiềm năng và các hạn chế của nó.

(Có nhiều tiêu chuẩn siêu dữ liệu, nhưng những tiêu chuẩn phù hợp nhất với GI là: ISO 19115: 2003 14 (Thông tin địa lý - Siêu dữ liệu); và • UK GEMINI - (sáng kiến tương tác siêu dữ liệu không gian địa lý)

Chất lượng dữ liệu

Quản lý dữ liệu tốt cũng đảm bảo rằng bộ dữ liệu có khả năng đáp ứng các nhu cầu hiện tại và phù hợp để khai thác trong tương lai. Khả năng tích hợp dữ liệu với các bộ dữ liệu khác có khả năng tăng thêm giá trị, khuyến khích sử dụng dữ liệu liên tục và tận dụng hiệu quả chi phí bỏ ra khi thu thập dữ liệu. Việc tạo, duy trì và phát triển dữ liệu chất lượng đòi hỏi một chế độ quản lý rõ ràng và cụ thể.

Quản lý dữ liệu

Tất cả các tập dữ liệu cần được quản lý bởi một cá nhân đầu mối (Người quản lý dữ liệu); còn được gọi là người quản lý tập dữ liệu và người lưu giữ dữ liệu. Người quản lý dữ liệu phải được giao trách nhiệm chính thức về việc quản lý từng tập dữ liệu chính. Họ phải chịu trách nhiệm về việc quản lý và duy trì lưu trữ dữ liệu được giao, phù hợp với chính sách dữ liệu đã xác định.

Kế hoạch quản lý dữ liệu

Người quản lý dữ liệu chịu trách nhiệm phát triển kế hoạch quản lý dữ liệu cho từng tập dữ liệu thuộc trách nhiệm của mình. Mục tiêu của kế hoạch quản lý dữ liệu là đảm bảo:

• Tập dữ liệu phù hợp với mục đích khi xây dựng.

• Việc quản lý lâu dài tập dữ liệu được xem xét để sử dụng lại giá trị tiềm năng sẽ phát sinh thêm.

Các kế hoạch quản lý cá nhân phải tuân thủ chính sách dữ liệu nội bộ bao gồm:

• Phạm vi của kế hoạch

• Liên kết tới siêu dữ liệu

• Trách nhiệm

• Quyền sở hữu trí tuệbản quyền

• Mục tiêu chất lượng

• Các tiêu chuẩn (quốc tế, quốc gia và địa phương) được thông qua trong quá trình thu thập dữ liệu.

Cần có nguồn lực để quản lý tập dữ liệu

• Tài nguyên vật lý cần thiết để quản lý tập dữ liệu

• Quản lý lâu dài tập dữ liệu

Quy trình quản lý dữ liệu

Các thủ tục quản lý dữ liệu. Một số hạng mục dữ liệu yêu cầu các quy trình hoạt động chi tiết để đảm bảo chất lượng của chúng; ví dụ các bộ dữ liệu khoa học và thống kê.

Truy cập và phổ biến dữ liệu

Truy cập, cung cấp và chia sẻ dữ liệu cần tuân theo hướng dẫn sau.

• Quyền truy cập công khai vào dữ liệu phải được cung cấp theo các quy định của pháp luật về phổ biến và chia sẻ thông tin.

• Quyền sở hữu trí tuệ của các tập dữ liệu thuộc sở hữu của các cơ quan công quyền phải được bảo vệ, vì dữ liệu phải được coi là tài sản.

• Quyền sở hữu trí tuệ của dữ liệu của bên thứ ba.

• Cần xem xét khả năng tái sử dụng và khai thác thương mại của tập dữ liệu.

• Quyền sử dụng hoặc cung cấp quyền truy cập vào dữ liệu có thể được chuyển cho bên thứ ba, tuân theo các chính sách về giá và phổ biến đã thỏa thuận.

Kiểm tra dữ liệu

Kiểm tra việc quản lý dữ liệu được khuyến nghị để đảm bảo rằng môi trường quản lý cho các bộ dữ liệu nhất định đang được duy trì và thực hiện đúng.

Kiểm tra dữ liệu phải đảm bảo rằng việc quản lý dữ liệu đã thực hiện đúng và đủ để các tài nguyên đã sử dụng đang được sử dụng một cách thích hợp. Việc đánh giá các bộ dữ liệu nên được thực hiện để xác định mức độ tuân thủ các chính sách dữ liệu cũng như các kế hoạch và thủ tục quản lý dữ liệu đã được soạn thảo.

  1. Thiết lập chính sách dữ liệu

a) Thu thập dữ liệu

• Tất cả các dự án và các hoạt động khác làm phát sinh bộ dữ liệu quan trọng sẽ thiết lập ngay từ đầu. Đảm bảo đánh giá và xác định dữ liệu đã tồn tại ở dạng có thể sử dụng được hay chưa, hoặc liệu dữ liệu mới có cần được thu thập hay không.

• Trước khi các dự án được phê duyệt, phải xác định cách thức khai thác toàn bộ dữ liệu thu được, ai sẽ chịu trách nhiệm khai thác toàn bộ dữ liệu và cách thức tối đa hóa và chia sẻ lợi ích.

• Các nhu cầu xử lý và lưu trữ dữ liệu tiếp theo sẽ được xem xét và đưa ra các kế hoạch để đảm bảo rằng cơ sở dữ liệu được duy trì theo cách mà sau đó có thể sử dụng tối đa chúng.

b) Duy trì dữ liệu

• Cơ sở dữ liệu sẽ được quản lý chặt chẽ, với trách nhiệm rõ ràng về việc quản lý được thiết lập và các cá nhân chịu trách nhiệm đảm bảo các quy trình quản lý dữ liệu được tuân thủ.

• Dữ liệu sẽ được lưu giữ an toàn trong cơ sở dữ liệu và được cung cấp đầy đủ để họ duy trì lâu dài.

• Tất cả dữ liệu sẽ được xác nhận và đảm bảo chất lượng trước khi được sử dụng hoặc lưu trữ.

• Quyền truy cập được cung cấp để nắm giữ dữ liệu, cho cả nhân viên và người sử dụng.

c) Sử dụng và trao đổi dữ liệu

• Biên bản Thỏa thuận sẽ được soạn thảo với người sử dụng nhận dữ liệu, liên quan đến việc sử dụng dữ liệu đó sau này. Chúng sẽ bao gồm các tuyên bố về tính bảo mật và các điều kiện sử dụng.

• Quyền sở hữu trí tuệ sẽ được bảo vệ liên quan đến bất kỳ sự phát triển nào của dữ liệu, bằng cách chỉ định các hạn chế đối với việc sử dụng dữ liệu trong các thỏa thuận cấp phép chính thức.

• Cung cấp đầy đủ được thực hiện để công chúng có thể truy cập dễ dàng nhất vào dữ liệu và siêu dữ liệu liên quan.

• Chi phí được phục hồi cho việc xử lý dữ liệu phù hợp với các chính sách của nội bộ.

• Việc trả chi phí khai thác dữ liệu được tính khi dữ liệu được chia sẻ cho các bên sử dụng vì mục đích thương mại.

Chính sách Dữ liệu sẽ được theo dõi thường xuyên và sẽ được sửa đổi theo sự phát triển và sau quá trình tổng kết kinh nghiệm. Các hoạt động xử lý thông tin sẽ được kiểm tra để giảm thiểu sự trùng lặp.

Trong phần trên, đã giới thiệu khái quát các  nội dung cơ bản của nguyên lý quản lý liệu tốt của Chính phủ Anh hướng dẫn cho các cơ quan, đơn vị thực hiện việc quản lý dữ liệu của mình. Hướng dẫn được ban hành với mục đích đảm bảo dữ liệu trong Chính phủ nhất quán và tin cậy. Mặc dù đây là hướng dẫn của Chính phủ anh phù hợp với luật pháp của Anh nhưng các thông tin được trích dẫn trong bài viết mang tính phổ quát và hữu ích khi nghiên cứu áp dụng tại Việt Nam. Quý vị muốn tìm hiểu sâu hơn xin đọc tài liệu tham khảo kèm theo.

Tài liệu tham khảo:

https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/14867/Good_dataMan.pdf


Tin xem nhiều

placeholder image

Hiện trạng triển khai các Cơ sở dữ liệu quốc gia