Dữ liệu cũng là một khái niệm rất trừu tượng, là thông tin đã được đưa vào
máy tính. Dữ liệu sau khi tập hợp lại và xử lí sẽ cho ta thông tin. Hay nói
cách khác, dữ liệu là thông tin đã được mã hoá trong máy.tính. Chẳng hạn,
con số điểm thi là một dữ liệu hoặc con số về nhiệt độ trong ngày là một dữ
liệu, hình ảnh về con người, phong cảnh cũng là những dữ liệu,...
Từ 'Data' bắt nguồn từ 'datum' có nghĩa là 'single piece of
information (mảnh thông tin đơn giản).'
Cơ sở dữ liệu là gì?
Cơ sở dữ liệu (Database) là một tập hợp các dữ liệu có tổ chức, thường được lưu trữ và truy cập điện tử từ hệ thống máy tính. Khi cơ sở dữ liệu phức tạp hơn, chúng thường được phát triển bằng cách sử dụng các kỹ thuật thiết kế và mô hình hóa chính thức.
Sự phát triển của cơ sở dữ liệu
Cơ sở dữ liệu đã hoàn thành hơn 50 năm hành trình phát triển của nó từ hệ thống tệp phẳng sang các hệ thống quan hệ và đối tượng. CDSL trãi qua nhiều thế hệ.
Sự phát triển
File-Based
Năm 1968 là năm mà cơ sở dữ liệu dựa trên tệp được giới thiệu. Cơ sở dữ
liệu dựa trên tệp, dữ liệu được duy trì trong một tệp phẳng. Mặc dù các tập
tin có nhiều lợi thế, nhưng vẫn còn một số hạn chế.
Một trong những lợi thế chính là hệ thống tệp có các phương thức truy cập
khác nhau, ví dụ: tuần tự, được lập chỉ mục và ngẫu nhiên.
Được sử dụng rộng rãi trong các ngôn ngữ lập trình thế hệ thứ ba như
COBOL, BASIC.
Mô hình dữ liệu phân cấp
1968-1980 là thời đại của Cơ sở dữ liệu phân cấp. Mô hình cơ sở dữ liệu
phân cấp nổi bật là DBMS đầu tiên của IBM. Nó được gọi là IMS (Hệ thống quản
lý thông tin).
Trong mô hình này, các
tệp có liên quan theo cách cha / con..
Dưới đây sơ đồ đại diện cho mô hình dữ liệu phân cấp. Vòng tròn nhỏ tượng
trưng cho các đối tượng
Giống như hệ thống tệp, mô hình này
cũng có một số hạn chế như triển khai phức tạp, thiếu tính độc lập về cấu
trúc, không thể dễ dàng xử lý một mối quan hệ nhiều-nhiều, v.v.
Mô hình dữ liệu mạng
Charles Bachman đã phát triển DBMS đầu tiên tại Honeywell có tên là Kho dữ
liệu tích hợp (IDS). Nó được phát triển vào đầu những năm 1960, nhưng nó đã
được chuẩn hóa vào năm 1971 bởi nhóm CODASYL (Hội nghị về Ngôn ngữ hệ thống
dữ liệu).
Trong mô hình này, các tệp có
liên quan với tư cách là chủ sở hữu và thành viên, giống như mô hình mạng
chung.
Mô hình dữ liệu mạng đã xác định các thành phần sau:
- Lược đồ mạng (Tổ chức cơ sở dữ liệu)
- Lược đồ phụ (chế độ xem cơ sở dữ liệu trên mỗi người dùng)
- Ngôn ngữ quản lý dữ liệu (thủ tục)
Mô hình này cũng có một số hạn chế như độ phức tạp của hệ thống và khó thiết kế và bảo trì.
Cơ sở dữ liệu quan hệ
1970 - Hiện tại: Đó là kỷ nguyên của Cơ sở dữ liệu quan hệ và Quản lý cơ
sở dữ liệu. Năm 1970, mô hình quan hệ được đề xuất bởi E.F. Codd.
Mô hình cơ sở dữ liệu quan hệ có hai thuật ngữ chính được gọi là thể hiện và lược đồ.
Ví dụ là một bảng có hàng hoặc cột
Lược đồ chỉ định cấu trúc như tên của mối quan hệ, loại của từng cột và tên.
Mô hình này sử dụng một số khái niệm toán học như lý thuyết tập hợp và logic vị ngữ.
Ứng dụng cơ sở dữ liệu internet đầu tiên đã được tạo ra vào năm 1995.
Cơ sở dữ liệu đám mây
Cơ sở dữ liệu đám mây tạo điều kiện cho bạn lưu trữ, quản lý và truy xuất
dữ liệu có cấu trúc, không cấu trúc của họ thông qua nền tảng đám mây. Dữ
liệu này có thể truy cập qua Internet. Cơ sở dữ liệu đám mây cũng được gọi
là cơ sở dữ liệu dưới dạng dịch vụ (DBaaS) vì chúng được cung cấp dưới dạng
dịch vụ được quản lý.
Trong kỷ nguyên của cơ sở dữ liệu quan hệ, nhiều mô hình khác đã được giới thiệu như mô hình hướng đối tượng, mô hình quan hệ đối tượng, v.v.
Một số dịch vụ đám mây tốt nhất là:
- AWS (Amazon Web Services)
- Snowflake Computing
- Oracle Database Cloud Services
- Microsoft SQL server
- Google cloud spanner
Ưu điểm của cơ sở dữ liệu đám mây
Giá rẻ
Nói chung, nhà cung cấp công ty không phải đầu tư vào cơ sở dữ liệu. Nó có thể duy trì và hỗ trợ một hoặc nhiều trung tâm dữ liệu.
Tự động
Cơ sở dữ liệu đám mây được làm phong phú với nhiều quy trình tự động như phục hồi, chuyển đổi dự phòng và tự động mở rộng quy mô.
Tăng khả năng tiếp cận
Bạn có thể truy cập cơ sở dữ liệu dựa trên đám mây của mình từ bất kỳ vị trí nào, bất cứ lúc nào. Tất cả bạn cần chỉ là một kết nối internet.
Cơ sở dữ liệu NoSQL
Cơ sở dữ liệu NoSQL là một cách tiếp cận để thiết kế các cơ sở dữ liệu như
vậy có thể chứa nhiều loại mô hình dữ liệu. NoQuery là viết tắt của "không
chỉ SQL." Nó là một thay thế cho cơ sở dữ liệu quan hệ truyền thống trong đó
dữ liệu được đặt trong các bảng và lược đồ dữ liệu được thiết kế hoàn hảo
trước khi cơ sở dữ liệu được xây dựng.
Cơ sở dữ liệu NoQuery rất hữu ích cho một tập hợp lớn dữ liệu phân tán.
Một số ví dụ về hệ thống cơ sở dữ liệu NoQuery với danh mục của chúng
là:
- MongoDB, CouchDB, Cloudant (Document-based)
- Memcached, Redis, Coherence (key-value store)
- HBase, Big Table, Accumulo (Tabular)
Ưu điểm của NoSQL
Khả năng mở rộng caoNoSQL có thể xử lý một lượng lớn dữ liệu vì khả năng mở rộng. Nếu dữ liệu phát triển, cơ sở dữ liệu NoQuery sẽ mở rộng quy mô để xử lý dữ liệu đó một cách hiệu quả.
Sẵn có cao
NoSQL hỗ trợ sao chép tự động. Tự động sao chép làm cho nó khả dụng cao bởi vì, trong trường hợp có bất kỳ lỗi nào, dữ liệu sẽ tự sao chép về trạng thái nhất quán trước đó.
Nhược điểm của NoSQL
Mã nguồn mở
NoSQL là một cơ sở dữ liệu nguồn mở, vì vậy chưa có tiêu chuẩn đáng tin cậy nào cho NoSQL.
Thử thách quản lý
Quản lý dữ liệu trong NoQuery phức tạp hơn nhiều so với cơ sở dữ liệu quan hệ. Nó là rất khó khăn để cài đặt và thậm chí bận rộn hơn để quản lý hàng ngày.
GUI không có sẵn
Các công cụ GUI cho cơ sở dữ liệu NoQuery không dễ dàng có sẵn trên thị trường.
Sao lưu
Sao lưu là một điểm yếu lớn cho cơ sở dữ liệu NoQuery. Một số cơ sở dữ liệu, như MongoDB, không có cách tiếp cận mạnh mẽ để sao lưu dữ liệu.
Cơ sở dữ liệu hướng đối tượng
Các cơ sở dữ liệu hướng đối tượng chứa dữ liệu ở dạng đối tượng và các lớp. Đối tượng là thực thể trong thế giới thực và các loại là tập hợp các đối tượng. Cơ sở dữ liệu hướng đối tượng là sự kết hợp của các tính năng mô hình quan hệ với các nguyên tắc hướng đối tượng. Nó là một triển khai thay thế cho mô hình quan hệ.
Cơ sở dữ liệu hướng đối tượng nắm giữ các quy tắc của lập trình hướng đối tượng. Một hệ thống quản lý cơ sở dữ liệu hướng đối tượng là một ứng dụng lai.
Mô hình cơ sở dữ liệu hướng đối tượng chứa các thuộc tính sau.
Các thuộc tính lập trình hướng đối tượng
- Objects
- Classes
- Inheritance
- Polymorphism
- Encapsulation
Các thuộc tính cơ sở dữ liệu quan hệ
- Atomicity
- Consistency
- Integrity
- Durability
- Concurrency
- Query processing
Cơ sở dữ liệu đồ thị
Một cơ sở dữ liệu đồ thị là một cơ sở dữ liệu NoQuery. Nó là một đại diện đồ họa của dữ liệu. Nó chứa các nút và cạnh. Một nút đại diện cho một thực thể và mỗi cạnh thể hiện mối quan hệ giữa hai cạnh. Mỗi nút trong cơ sở dữ liệu đồ thị đại diện cho một định danh duy nhất.
Cơ sở dữ liệu đồ thị có lợi cho việc tìm kiếm mối quan hệ giữa dữ liệu vì chúng làm nổi bật mối quan hệ giữa các dữ liệu liên quan.
Cơ sở dữ liệu đồ thị rất hữu ích khi cơ sở dữ liệu chứa một mối quan hệ phức tạp và lược đồ động.
Nó chủ yếu được sử dụng trong quản lý chuỗi cung ứng, xác định nguồn điện thoại IP.
DBMS (Hệ thống quản lý cơ sở dữ liệu)
Hệ thống quản lý cơ sở dữ liệu là phần mềm được sử dụng để lưu trữ và truy
xuất cơ sở dữ liệu. Ví dụ: Oracle, MySQL, v.v.; đây là một số công cụ DBMS
phổ biến.
- DBMS cung cấp giao diện để thực hiện các hoạt động khác nhau như tạo, xóa, sửa đổi, v.v.
- DBMS cho phép người dùng tạo cơ sở dữ liệu của họ theo yêu cầu của họ.
- DBMS chấp nhận yêu cầu từ ứng dụng và cung cấp dữ liệu cụ thể thông qua hệ điều hành.
- DBMS chứa nhóm các chương trình hoạt động theo hướng dẫn người dùng.
- Nó cung cấp bảo mật cho cơ sở dữ liệu.
Ưu điểm của DBMS
Kiểm soát dự phòng
Nó lưu trữ tất cả dữ liệu trong một tệp cơ sở dữ liệu, do đó nó có thể kiểm soát dự phòng dữ liệu.
Chia sẻ dữ liệu
Một người dùng được ủy quyền có thể chia sẻ dữ liệu giữa nhiều người dùng.
Sao lưu
Nó cung cấp hệ thống con phục hồi và phục hồi. Hệ thống khôi phục này tạo dữ liệu tự động từ lỗi hệ thống và khôi phục dữ liệu nếu được yêu cầu.
Nhiều giao diện người dùng
Nó cung cấp một loại giao diện người dùng khác nhau như GUI, giao diện ứng dụng.
Nhược điểm của DBMS
Kích thước
Nó chiếm không gian đĩa lớn và bộ nhớ lớn để chạy hiệu quả.
Giá cả
DBMS yêu cầu bộ xử lý dữ liệu tốc độ cao và bộ nhớ lớn hơn để chạy phần mềm DBMS, do đó rất tốn kém.
Phức tạp
DBMS tạo ra sự phức tạp và yêu cầu bổ sung.
RDBMS (Hệ thống quản lý cơ sở dữ liệu quan hệ)
Từ RDBMS được gọi là 'Hệ thống quản lý cơ sở dữ liệu quan hệ.' Nó được
biểu diễn dưới dạng bảng chứa hàng và cột.
RDBMS dựa trên mô hình quan hệ; nó được giới thiệu bởi E. F. Codd.
Một cơ sở dữ liệu quan hệ chứa các thành phần sau:
- Table
- Record/ Tuple
- Field/Column name /Attribute
- Instance
- Schema
- Keys
RDBMS là một DBMS dạng bảng duy trì tính bảo mật, tính toàn vẹn, tính chính xác và tính nhất quán của dữ liệu.
Mobile Tips nhận dịch vụ quảng cáo bài viết, đặt backlink, website vệ tinh cho website của bạn!!!
0 Nhận xét