angle-left null Nghiên cứu và phân tích các mô hình cơ sở dữ liệu phổ biến
Trang chủ

18/05/2020 03:18

(data.gov.vn) Ngày nay, dữ liệu là thành phần quan trọng nhất trong thế giới bởi vì nó được sử dụng trong cuộc sống hàng ngày từ cá nhân cho đến các tổ chức. Cơ sở dữ liệu là một phần quan trọng của bất kỳ tổ chức nào bởi vì tất cả các thông tin đều được lưu giữ trong cơ sở dữ liệu để tất cả người dùng có thể dễ dàng truy cập một cách tốt nhất

Mô hình cơ sở dữ liệu là một cấu trúc logic của cơ sở dữ liệu để xác định cách mà dữ liệu sẽ được lưu trữ, lấy ra và cập nhật mối quan hệ tồn tại giữa các mục dữ liệu. Có nhiều mô hình dữ liệu khác nhau đã xuất hiện trong những năm qua. Trong bài viết này, 4 mô hình cơ sở dữ liệu phổ biến sẽ được giới thiệu ngắn gọn và thảo luận những đặc điểm cơ bản: Mô hình phân cấp, mô hình mạng, mô hình quan hệ và mô hình hướng đối tượng. Mục đích chính của bài viết này là tìm hiểu và so sánh các tính năng của các mô hình cơ sở dữ liệu này, để hiểu được ưu và nhược điểm của các mô hình trước khi đưa vào triển khai chúng.

I. Giới thiệu về mô hình phân cấp (Hierarchical Model)

          Mô hình phân cấp bao gồm một tập hợp các bản ghi được nối với nhau thông qua các liên kết. Một bản ghi là một tập hợp các trường, mỗi trường chỉ chứa một giá trị dữ liệu. Một liên kết là liên kết giữa hai bản ghi. Do đó, mô hình phân cấp tương tự như mô hình mạng theo nghĩa là dữ liệu và mối quan hệ giữa dữ liệu cũng được biểu diễn bằng các bản ghi và liên kết tương ứng.

          Sơ đồ cấu trúc cây là một lược đồ cho cơ sở dữ liệu phân cấp, bao gồm hai thành phần cơ bản: hộp (boxes), tương ứng với các loại bản ghi và dòng, tương ứng với các liên kết. Sơ đồ cấu trúc cây phục vụ cùng mục đích như sơ đồ thực thể liên kết E-R, nó chỉ định cấu trúc logic tổng thể của cơ sở dữ liệu. Sơ đồ cấu trúc cây tương tự như sơ đồ cấu trúc dữ liệu trong mô hình mạng. Đối với mỗi sơ đồ E-R, có một sơ đồ cấu trúc cây tương ứng. Do đó, lược đồ cơ sở dữ liệu được biểu diễn dưới dạng tập hợp các sơ đồ cấu trúc cây.

          Trong mô hình dữ liệu phân cấp, thông tin được tổ chức như một tập hợp các bản ghi, được biểu diễn dưới dạng cây, cây này có thể có độ sâu tùy ý. Bản ghi tại gốc của cây bắt đầu từ số 0 và có nhiều bản ghi được gọi là bản ghi con. Một bản ghi ở trên cùng của cây được gọi là bản ghi cha, mối quan hệ đệ quy của bản ghi cha - con này tiếp tục hình thành một cây. Mỗi bản ghi chứa nhiều trường, trong đó mỗi trường chỉ chứa một giá trị dữ liệu như số nguyên, số thực, văn bản hoặc một con trỏ tới bản ghi. Con trỏ không được phép tạo thành một chu trình. Hệ quản trị cơ sở dữ liệu DBMS (Database Management System) phân cấp hỗ trợ các giá trị null hoặc các trường có độ dài biến đổi.

          Các ứng dụng có thể truy xuất cơ sở dữ liệu phân cấp bằng cách bắt đầu từ gốc và tiếp tục đi xuống từ nút cha mẹ sang nút con cho đến khi tìm thấy bản ghi mong muốn. Việc tìm kiếm bất kỳ bản ghi nào trong cây phân cấp đều được thực hiện rất nhanh và đơn giản bởi vì cơ sở dữ liệu phân cấp sử dụng bộ nhớ tiếp giáp cho cấu trúc phân cấp. Đối với mô hình dữ liệu phân cấp, Ngôn ngữ định nghĩa dữ liệu DDL (Data Definition Language) phải hỗ trợ định nghĩa các loại trường, loại bản ghi, con trỏ và mối quan hệ cha-con. Mô hình dữ liệu phân cấp chỉ hỗ trợ dữ liệu độc lập có giới hạn và không thể hiện các mô hình thông tin phức tạp. Dữ liệu được nhân rộng thành cùng một cây hoặc các cây khác nhau. Nhược điểm của mô hình dữ liệu phân cấp là có thể cùng có thông tin được lưu trữ nhiều lần và mô hình không hỗ trợ tính nhất quán và bảo mật thông tin.

II. Giới thiệu về mô hình mạng (Network Model)

          Mô hình dữ liệu mạng bao gồm một tập hợp các bản ghi được nối với nhau thông qua các liên kết, các bản ghi này tương tự như một thực thể trong mô hình thực thể liên kết E-R. Mỗi bản ghi là một tập hợp các trường (thuộc tính - attributes), mỗi trường chỉ chứa một giá trị dữ liệu. Sơ đồ cấu trúc dữ liệu là một lược đồ cho cơ sở dữ liệu mạng. Một sơ đồ như vậy bao gồm hai thành phần cơ bản: hộp (boxes), tương ứng với các loại bản ghi và dòng, tương ứng với các liên kết. Một sơ đồ cấu trúc dữ liệu phục vụ cùng một mục đích như sơ đồ E-R; cụ thể là, nó chỉ định cấu trúc logic tổng thể của cơ sở dữ liệu. Đối với mỗi sơ đồ E-R, có một sơ đồ cấu trúc dữ liệu tương ứng.

          Vào cuối những năm 1960, một số hệ thống cơ sở dữ liệu thương mại dựa trên mô hình mạng đã xuất hiện. Các hệ thống này được nghiên cứu rộng rãi bởi Nhóm tác vụ cơ sở dữ liệu DBTG (Database Task Group) trong nhóm CODASYL.

          Dữ liệu trong mô hình dữ liệu mạng được tổ chức như một tập hợp các đồ thị của bản ghi có liên quan với con trỏ. Một con trỏ là một địa chỉ vật lý xác định nơi mà các bản ghi tiếp theo có thể được tìm thấy trên đĩa. Mô hình dữ liệu mạng linh hoạt hơn mô hình dữ liệu phân cấp và vẫn hỗ trợ điều hướng hiệu quả.

          Mô hình dữ liệu mạng chứa các bản ghi là tập hợp các trường trong đó mỗi trường chứa một giá trị đơn giản hoặc là kích thước cố định hoặc các biến. Mô hình dữ liệu mạng cũng hỗ trợ các chỉ mục của các trường và bản ghi, bộ con trỏ và vị trí vật lý của bản ghi. Đối với các mô hình dữ liệu mạng, Ngôn ngữ định nghĩa dữ liệu DDL cho phép định nghĩa các loại bản ghi, loại, con trỏ và chỉ mục của trường. Và Ngôn ngữ thao tác dữ liệu DML (Data Manipulation Language) hỗ trợ điều hướng thông qua các đồ thị, con trỏ và chỉ mục. Mô hình dữ liệu mạng điều hướng chặt chẽ các cấu trúc lưu trữ vật lý. Dữ liệu được nhân rộng vào cùng một biểu đồ hoặc đồ thị khác nhau. Nhược điểm của mô hình dữ liệu này là có thể có cùng một thông tin được lưu trữ nhiều lần. Mô hình dữ liệu mạng hỗ trợ dữ liệu độc lập có giới hạn và không hỗ trợ tính nhất quán và bảo mật dữ liệu.

III. Giới thiệu mô hình cơ sở dữ liệu quan hệ (Relation database Model)

          Một trong những ứng dụng quan trọng nhất cho máy tính là lưu trữ và quản lý thông tin. Cách thức tổ chức thông tin có thể có ảnh hưởng sâu sắc đến việc truy cập và quản lý thông tin, cách đơn giản nhất để sắp xếp thông tin là lưu trữ nó trong bảng. Mô hình cơ sở dữ liệu quan hệ biểu thị cơ sở dữ liệu như một tập hợp các quan hệ. Mô hình cơ sở dữ liệu quan hệ đã tồn tại hơn 20 năm và được phát triển bởi E.F.Codd. Trong mô hình này, mối quan hệ giữa các dữ liệu được biểu diễn dưới dạng bảng. Bảng là một tập hợp các hàng và cột, cột chứa các giá trị dữ liệu đơn giản từ một số miền như số nguyên (integer), số thực (real), văn bản (tex)... và hàng chứa số trường được gọi là bản ghi. Mô hình này dựa trên đại số quan hệ. Mỗi cột chứa một giá trị nguyên tử cho mỗi bản ghi và mỗi cột có một tên duy nhất. Mô hình quan hệ ngoài việc hỗ trợ khái niệm các khóa để xác định các bản ghi và tạo mối quan hệ giữa 2 hoặc nhiều bảng thì nó cũng hỗ trợ dữ liệu độc lập và tối ưu hóa truy vấn. Hình thức kiểm soát truy cập thông thường nhất trong cơ sở dữ liệu quan hệ là khung nhìn. Khung nhìn là một bảng logic, được tạo ra với lệnh SQL VIEW. Mô hình cơ sở dữ liệu quan hệ có tính bảo mật, nhất quán cao và tránh sự dư thừa của các bản ghi. Mô hình này được hỗ trợ bởi khái niệm về cơ sở dữ liệu phân tán (Distributed Database). Mô hình cơ sở dữ liệu quan hệ cung cấp một nền tảng quan trọng và trung tâm để quản lý dữ liệu và giải quyết truy vấn. Hình dưới đây sẽ biểu diễn cơ sở dữ liệu quan hệ.

IV. Giới thiệu về mô hình cơ sở dữ liệu hướng đối tượng (Object-Oriented database Model)

          Mô hình dữ liệu hướng đối tượng được thiết lập dựa trên khái niệm về lập trình hướng đối tượng, để xác định cấu trúc dữ liệu. Việc phát triển mô hình cơ sở dữ liệu hướng đối tượng thể hiện nỗ lực tích hợp các nguyên tắc mô hình hóa dữ liệu và kỹ thuật phần mềm của các thiết kế ngôn ngữ lập trình được hỗ trợ bởi công nghệ cơ sở dữ liệu.

          Phần tử cơ bản của mô hình cơ sở dữ liệu hướng đối tượng chính là đối tượng, hoạt động như một thực thể thời gian chạy và mọi đối tượng lại có một trạng thái, hành vi và định danh duy nhất. Lớp cơ sở dữ liệu hướng đối tượng là một thùng chứa dữ liệu và các phương thức kỹ thuật đóng gói. Các phương thức kỹ thuật sử dụng để thực hiện đóng gói được thao tác trên các mục dữ liệu. Các lớp được sắp xếp theo dạng phân cấp. Trong hệ thống phân cấp này, ở lớp gốc, một lớp được gọi là lớp cha và các lớp khác kế thừa (sử dụng) các thuộc tính của lớp cha được gọi là lớp con (phần tử). Tùy theo nhu cầu của người dùng, các thuộc tính này có thể được sửa đổi trong lớp con. Một đối tượng có thể tương tác với đối tượng khác bằng cách truyền thông điệp cho nhau, mô hình này cung cấp khả năng tái sử dụng dữ liệu và phương pháp kế thừa dữ liệu. Dữ liệu có thể là dữ liệu trừu tượng, cung cấp nhiều bảo mật và tích hợp cơ sở dữ liệu cho người dùng. Hình dưới đây biểu diễn cơ sở dữ liệu hướng đối tượng.

V. So sánh sự khác nhau giữa các mô hình cơ sở dữ liệu

1. Mô hình cơ sở dữ liệu phân cấp

          Mô hình cơ sở dữ liệu phân cấp là khái niệm rất đơn giản nhưng việc thực hiện mô hình này rất phức tạp. Mô hình này ít có khả năng quản lý dữ liệu khổng lồ; hạn chế hỗ trợ tính toàn vẹn của cơ sở dữ liệu và độc lập về cấu trúc.

2. Mô hình cơ sở dữ liệu mạng

          Mô hình cơ sở dữ liệu mạng là khái niệm rất đơn giản như mô hình phân cấp nhưng việc triển khai thực hiện rất phức tạp. Mô hình này xử lý nhiều loại mối quan hệ giữa các dữ liệu hơn và hỗ trợ tính toàn vẹn dữ liệu nhiều hơn so với mô hình cơ sở dữ liệu phân cấp. Mô hình này thiếu sự độc lập về cấu trúc và các tiêu chuẩn dữ liệu.

3. Mô hình cơ sở dữ liệu quan hệ

          Mô hình cơ sở dữ liệu quan hệ hoạt động dựa trên khái niệm về tập hợp các lý thuyết về toán học. Trong tập hợp lý thuyết, việc thu thập thông tin hai chiều được gọi là mối quan hệ. Hệ thống quản lý cơ sở dữ liệu quan hệ RDBMS (Relational Data Base Management System) cung cấp cách thức đơn giản để xây dựng, truy cập và cập nhật cơ sở dữ liệu. Mô hình này chỉ hỗ trợ lưu trữ dữ liệu dưới dạng văn bản và giá trị số, nó không hỗ trợ lưu trữ kiểu dữ liệu trừu tượng như âm thanh, video và thông tin địa lý.

4. Mô hình cơ sở dữ liệu hướng đối tượng

          Mô hình cơ sở dữ liệu hướng đối tượng là sự kết hợp giữa khái niệm về lập trình hướng đối tượng với công nghệ cơ sở dữ liệu để cung cấp một hệ thống phát triển ứng dụng tích hợp. Mô hình này hỗ trợ kiểu dữ liệu trừu tượng như âm thanh, video và thông tin địa lý. Trong Hệ thống quản lý cơ sở dữ liệu hướng đối tượng OODBMS (Object-Oriented Database Management System), chúng ta có thể cải thiện năng suất dựa trên việc hỗ trợ truy cập điều hướng và liên kết thông tin.

Kết luận

          Một trong những mục tiêu chính của hệ thống cơ sở dữ liệu là xử lý việc lưu trữ dữ liệu liên tục cho các ứng dụng. Bằng cách sử dụng hệ thống cơ sở dữ liệu, các nhà phát triển ứng dụng không cần phải lo lắng về việc dữ liệu được tổ chức liên tục trong bộ lưu trữ thứ cấp như thế nào. Tuy nhiên, họ phải quan tâm đến việc quản lý dữ liệu liên tục bằng mô hình dữ liệu được trình bày bởi hệ thống cơ sở dữ liệu. Trước đây, các mô hình dữ liệu đã được thiết kế độc lập về dữ liệu, dễ dàng mô hình hóa trong thế giới thực (đối với các miền trong thế giới thực bị hạn chế) và dễ dàng cung cấp các tính năng cơ sở dữ liệu mong muốn khác, ít hoặc không xem xét đến nhu cầu của các ứng dụng để tính toán dữ liệu liên tục khi sử dụng để triển khai các ứng dụng.

          Từ nghiên cứu trên cho thấy, mô hình cơ sở dữ liệu phân cấp và mô hình cơ sở dữ liệu mạng đều không thể đáp ứng yêu cầu hiện tại về môi trường cộng tác. Mô hình cơ sở dữ liệu quan hệ là một mô hình mạnh và tiêu chuẩn nhưng nó cũng không thể xử lý dữ liệu trừu tượng như dữ liệu âm thanh, dữ liệu video, dữ liệu địa lý và các ứng dụng khác. Mô hình cơ sở dữ liệu hướng đối tượng được tạo ra nhằm tích hợp hầu hết các tính năng mong muốn của hệ thống cơ sở dữ liệu và hỗ trợ các yêu cầu thiết kế, triển khai cơ sở dữ liệu lớn và phức tạp. Mô hình cơ sở dữ liệu hướng đối tượng cũng thể hiện tiềm năng hơn các mô hình dữ liệu khác dựa trên khả năng tham chiếu, thiết kế phức tạp và khả năng thực thi các toán tử, góp phần xây dựng các ứng dụng cơ sở dữ liệu hiệu quả hơn.

          Các mô hình cơ sở dữ liệu này được xây dựng, cập nhật và duy trì sẽ đáp ứng các yêu cầu về truy nhập dữ liệu và sử dụng thông tin của các ngành kinh tế và phục vụ lợi ích công cộng.

theo http://qcvn109.gov.vn/cong-nghe/nghien-cuu-va-phan-tich-cac-mo-hinh-co-so-du-lieu-pho-bien.html


Tin xem nhiều

placeholder image

Tổng hợp hiện trạng mã định danh của các đơn vị cấp 1 sử dụng cho định dạng gói tin phục vụ kết nối các hệ thống văn bản quản lý và điều hành