Khái niệm data integrity và vì sao quy trình này quan trọng
BÀI LIÊN QUAN
Database Replication là gì? Sao chép cơ sở dữ liệu hoạt động như thế nào?Data activation là gì và hoạt động như thế nào?Data visualization là gì và tầm quan trọng của data visualizationData integrity là gì?
Data integrity hay tính toàn vẹn dữ liệu là tính chính xác, đầy đủ và chất lượng của dữ liệu khi dữ liệu được duy trì theo thời gian và trên các định dạng.
Việc duy trì tính toàn vẹn dữ liệu của công ty, doanh nghiệp là một quá trình liên tục. Cần lưu ý rằng tính toàn vẹn dữ liệu không giống như bảo mật dữ liệu, mặc dù hai khái niệm này có liên quan với nhau.
Bảo mật dữ liệu liên quan đến việc bảo vệ dữ liệu khỏi các mối đe dọa bên ngoài và bên trong và duy trì quyền riêng tư của các đối tượng dữ liệu. Điều này góp phần vào Data integrity - tính toàn vẹn của dữ liệu bằng cách đảm bảo dữ liệu không bị xâm phạm bởi những mối đe dọa đó.
Các mối đe dọa đối với tính toàn vẹn dữ liệu có thể bao gồm:
- Lỗi do con người: Chẳng hạn, vô tình xóa một hàng dữ liệu trong bảng tính
- Sự không nhất quán giữa các định dạng: Ví dụ: một tập hợp dữ liệu trong Microsoft Excel dựa trên tham chiếu ô có thể không chính xác ở định dạng khác không cho phép các ô đó được tham chiếu
- Lỗi thu thập: Chẳng hạn, dữ liệu được thu thập không chính xác hoặc thiếu thông tin, tạo ra một bức tranh không đầy đủ về chủ đề
- An ninh mạng hoặc vi phạm quyền riêng tư nội bộ: Ví dụ: ai đó xâm nhập vào cơ sở dữ liệu của công ty bạn với ý định làm hỏng hoặc đánh cắp thông tin hoặc nhân viên nội bộ làm hỏng dữ liệu với mục đích xấu
Các loại toàn vẹn dữ liệu
Việc duy trì data integrity - tính toàn vẹn dữ liệu đòi hỏi sự hiểu biết về hai loại tính toàn vẹn của dữ liệu: tính toàn vẹn về mặt vật lý và tính toàn vẹn về logic. Cả hai đều là tập hợp các quy trình và phương pháp thực thi tính toàn vẹn của dữ liệu trong cả cơ sở dữ liệu phân cấp và cơ sở dữ liệu quan hệ.
Tính toàn vẹn về thể chất
Tính toàn vẹn vật lý là sự bảo vệ tính toàn vẹn và chính xác của dữ liệu đó khi dữ liệu được lưu trữ và truy xuất. Khi thiên tai xảy ra, mất điện hoặc tin tặc phá vỡ các chức năng của cơ sở dữ liệu, tính toàn vẹn vật lý sẽ bị tổn hại. Lỗi của con người, xói mòn bộ nhớ và một loạt các vấn đề khác cũng có thể khiến người quản lý xử lý dữ liệu, lập trình viên hệ thống, lập trình viên ứng dụng và kiểm toán viên nội bộ không thể có được dữ liệu chính xác.
Tính toàn vẹn logic
Tính toàn vẹn logic giữ cho dữ liệu không thay đổi khi nó được sử dụng theo những cách khác nhau trong cơ sở dữ liệu quan hệ. Tính toàn vẹn logic bảo vệ dữ liệu khỏi lỗi của con người và tin tặc, nhưng theo một cách khác nhiều so với tính toàn vẹn vật lý. Có bốn loại toàn vẹn logic:
-
Tính toàn vẹn thực thể
Tính toàn vẹn của thực thể dựa vào việc tạo các khóa chính - các giá trị duy nhất xác định các phần dữ liệu - để đảm bảo rằng dữ liệu không được liệt kê nhiều lần và không có trường nào trong bảng là rỗng. Đó là một tính năng của các hệ thống quan hệ lưu trữ dữ liệu trong các bảng có thể được liên kết và sử dụng theo nhiều cách khác nhau.
-
Toàn vẹn tham chiếu
Tính toàn vẹn tham chiếu đề cập đến một loạt quy trình đảm bảo dữ liệu được lưu trữ và sử dụng thống nhất. Các quy tắc được nhúng vào cấu trúc của cơ sở dữ liệu về cách sử dụng khóa ngoại đảm bảo rằng chỉ những thay đổi, bổ sung hoặc xóa dữ liệu thích hợp mới xảy ra. Các quy tắc có thể bao gồm các ràng buộc loại bỏ việc nhập dữ liệu trùng lặp, đảm bảo rằng mục nhập dữ liệu là chính xác và/hoặc không cho phép nhập dữ liệu không áp dụng.
-
Toàn vẹn tên miền
Tính toàn vẹn tên miền là tập hợp các quy trình đảm bảo tính chính xác của từng phần dữ liệu trong miền. Trong ngữ cảnh này, miền là một tập hợp các giá trị có thể chấp nhận được mà một cột được phép chứa. Nó có thể bao gồm các ràng buộc và các biện pháp khác giới hạn định dạng, loại và lượng dữ liệu được nhập.
-
Tính toàn vẹn do người dùng xác định
Tính toàn vẹn do người dùng định nghĩa liên quan đến các quy tắc và ràng buộc do người dùng tạo ra để phù hợp với nhu cầu cụ thể của họ. Đôi khi thực thể, tham chiếu và tính toàn vẹn của miền không đủ để bảo vệ dữ liệu. Thông thường, các quy tắc kinh doanh cụ thể phải được tính đến và kết hợp vào các biện pháp toàn vẹn dữ liệu.
Tại sao data integrity lại quan trọng?
Đạt được và duy trì tính toàn vẹn dữ liệu có thể giúp tổ chức của bạn tiết kiệm được thời gian, công sức và tiền bạc khi đưa ra quyết định lớn. Trường hợp quyết định dựa trên dữ liệu không chính xác hoặc không đầy đủ thì quyết định có thể sai lầm. Xét cho cùng, các quyết định dựa trên dữ liệu chỉ có thể đạt hiệu quả cao nhất như dữ liệu mà chúng dựa trên. Nếu tính toàn vẹn dữ liệu của công ty bạn bị xâm phạm theo bất kỳ cách nào, thì tác động tiêu cực có thể kéo dài và ảnh hưởng sâu rộng.
Ngoài việc hỗ trợ quá trình ra quyết định mạnh mẽ, tính toàn vẹn của dữ liệu còn bảo vệ thông tin và hình ảnh của chủ thể dữ liệu của bạn. Ví dụ: bạn có thể thu thập thông tin nhận dạng cá nhân (PII) của khách hàng, chẳng hạn như tên đầy đủ, số An sinh xã hội, địa chỉ và thông tin thẻ tín dụng của họ. Nếu tập dữ liệu xảy ra lỗi - cho dù đó là lỗi đánh máy ngẫu nhiên hay nỗ lực tấn công độc hại từ bên ngoài - thông tin của khách hàng của bạn không những có thể rơi vào tay kẻ xấu mà còn bị xuyên tạc.
Điều này cũng có thể xảy ra với dữ liệu của bên thứ nhất, là thông tin thu được từ việc theo dõi hành động của người dùng hoặc đặt câu hỏi cho họ. Mặc dù thông tin này không nhạy cảm bằng số An sinh xã hội của họ, nhưng bất kỳ lỗi nào cũng có thể ảnh hưởng đến cách họ được công ty xem và do đó, cách họ tương tác và được đưa vào các mục tiêu lớn hơn và quan trọng trọng hơn.
Vì lợi ích của khách hàng, chủ thể dữ liệu và tổ chức, bạn nên đạt được và duy trì tính toàn vẹn dữ liệu.
Rủi ro đối với tính toàn vẹn dữ liệu
Một loạt các yếu tố có thể ảnh hưởng đến tính toàn vẹn dữ liệu được lưu trữ trong cơ sở dữ liệu. Một số ví dụ bao gồm:
- Lỗi của con người: Khi các cá nhân nhập thông tin không chính xác, sao chép hoặc xóa dữ liệu, không tuân theo các giao thức thích hợp hoặc mắc lỗi trong quá trình thực hiện các quy trình nhằm bảo vệ thông tin, tính toàn vẹn dữ liệu sẽ gặp nguy hiểm.
- Lỗi truyền: Khi dữ liệu không thể truyền thành công từ một vị trí trong cơ sở dữ liệu sang một vị trí khác, nghĩa là đã xảy ra lỗi truyền. Lỗi truyền xảy ra khi một phần dữ liệu có trong bảng đích nhưng không có trong bảng nguồn trong cơ sở dữ liệu quan hệ.
- Lỗi và vi-rút: Phần mềm gián điệp, phần mềm độc hại và vi-rút là những phần mềm có thể xâm nhập máy tính và thay đổi, xóa hoặc đánh cắp dữ liệu.
- Phần cứng bị xâm phạm: Máy tính hoặc máy chủ đột ngột gặp sự cố và các sự cố về cách hoạt động của máy tính hoặc thiết bị khác là những ví dụ về lỗi nghiêm trọng và có thể là dấu hiệu cho thấy phần cứng của bạn bị xâm phạm. Phần cứng bị xâm phạm có thể hiển thị dữ liệu không chính xác hoặc không đầy đủ, hạn chế hoặc loại bỏ quyền truy cập vào dữ liệu hoặc khiến thông tin khó sử dụng.
Rủi ro đối với tính toàn vẹn dữ liệu có thể dễ dàng được giảm thiểu hoặc loại bỏ bằng cách thực hiện như sau:
- Hạn chế quyền truy cập vào dữ liệu và thay đổi quyền để hạn chế thay đổi thông tin bởi các bên trái phép
- Xác thực dữ liệu để đảm bảo dữ liệu chính xác cả khi dữ liệu được thu thập và khi dữ liệu được sử dụng
- Sao lưu dữ liệu
- Sử dụng nhật ký để theo dõi khi dữ liệu được thêm, sửa đổi hoặc xóa
- Thực hiện kiểm tra nội bộ thường xuyên
- Sử dụng phần mềm phát hiện lỗi
Cách để duy trì tính toàn vẹn dữ liệu
Có một số cách bạn có thể đạt được và duy trì tính toàn vẹn của bộ dữ liệu của tổ chức mình.
Đảm bảo dữ liệu chính xác, đầy đủ và chất lượng cao
Việc tìm kiếm tính toàn vẹn dữ liệu bắt đầu trong giai đoạn thiết lập kho dữ liệu. Hãy tự hỏi: Phương pháp thu thập dữ liệu của tôi có cung cấp thông tin chính xác không? Tôi có thể đảm bảo không có dữ liệu nào bị thiếu nếu tôi thu thập dữ liệu theo cách này không? Tôi có nhận được dữ liệu từ một nguồn chất lượng cao, đáng tin cậy không?
Sau khi thiết kế phương pháp thu thập của bạn, hãy đánh giá lại xem nó có hoạt động như dự kiến hay không. Nếu không, hãy thực hiện các thay đổi cần thiết đối với thiết kế của nó và ghi nhớ. Bắt đầu với tính toàn vẹn dữ liệu dễ dàng hơn nhiều so với việc khắc phục dữ liệu bị lỗi.
Cẩn thận kiểm tra lỗi
Lỗi của con người là một trong những cách dễ nhất làm mất tính toàn vẹn dữ liệu, nhưng nó cũng nằm trong tầm kiểm soát của bạn. Ngoài việc kiểm tra công việc của bạn, nhờ người khác xem lại và cẩn thận, có những thủ thuật có thể giúp bạn bắt lỗi. Một điều đơn giản như tô bóng mọi hàng khác của tập dữ liệu có thể giúp bạn theo dõi từng điểm duy nhất.
Nhận biết các mối đe dọa an ninh mạng
Những người có ý định đánh cắp hoặc làm hỏng dữ liệu có thể gửi một liên kết trong email hoặc tin nhắn văn bản có chứa phần mềm độc hại, liên kết này sẽ được kích hoạt khi bạn nhấp vào liên kết. Có nhiều cách khác để tin tặc có thể truy cập vào dữ liệu của bạn và việc có thể nhận ra chúng có thể giúp đảm bảo tính toàn vẹn dữ liệu được bảo vệ.
Data integrity hay tính toàn vẹn dữ liệu là điều bắt buộc cần đến để duy trì tính hữu ích của dữ liệu. Tính toàn vẹn dữ liệu có thể duy trì được bằng nhiều cách khác nhau.