Dark data là gì? Tầm quan trọng của Dark Data đối với doanh nghiệp

Thứ sáu, 07/10/2022-10:10
Trong kinh doanh, các kỹ thuật thu thập và phân tích dữ liệu về khách hàng và tình hình thị trường nói chung rất phổ biến. Nếu không có dữ liệu này, doanh nghiệp không thể lập kế hoạch phát triển, thậm chí không thể đưa ra bất kỳ quyết định nào, bởi bất kỳ hoạt động nào cũng bắt đầu bằng việc thu thập dữ liệu. Dữ liệu chính là chìa khóa thành công của bất kỳ doanh nghiệp nào.

Dark data là gì?

Dark data là tất cả những dữ liệu sẵn có của một tổ chức nhưng không được sử dụng, không xác định và không được khai thác. Theo định nghĩa của Gartner Inc, dark data được là tài nguyên dữ liệu mà doanh nghiệp thu thập, phân tích và lưu giữ trong quá trình hoạt động kinh doanh bình thường nhưng không sử dụng cho các mục đích khác, chẳng hạn như phân tích dữ liệu, phát triển kinh doanh hay kiếm tiền trực tiếp…


Theo Think Leaf, trong kho lưu trữ của các tổ chức, dữ liệu kinh doanh quan trọng chỉ chiếm 15%, còn lại là ROT chiếm 25%, dark data chiếm đến 60%.
Theo Think Leaf, trong kho lưu trữ của các tổ chức, dữ liệu kinh doanh quan trọng chỉ chiếm 15%, còn lại là ROT chiếm 25%, dark data chiếm đến 60%.

Thông thường, dark data là nguyên nhân dẫn đến việc các doanh nghiệp gặp phải hội chứng DRIP, viết tắt của Data Rich, Information Poor. Điều này xảy ra khi các công ty thu thập rất nhiều dữ liệu nhưng không có sẵn các công cụ để biến nó thành thông tin có giá trị.

Trong nhiều trường hợp khác, các tổ chức cũng có thể cho rằng những dữ liệu này đã quá cũ, không còn giá trị, hoặc là những dữ liệu không đầy đủ, dư thừa và thậm chí là họ không biết đến sự tồn tại của nó. 

Theo một cuộc khảo sát gần đây của Splunk, dark data chiếm đến 55% lượng dữ liệu các công ty thu thập được, điều này có nghĩa là hơn một nửa dữ liệu đã thu thập không bao giờ được sử dụng.

Giả sử bạn muốn kiểm tra số dư ngân hàng của mình thông qua tài khoản ngân hàng trực tuyến, bạn nghĩ rằng về phía mình, dữ liệu duy nhất bạn cung cấp là dữ liệu đăng nhập của bạn chẳng hạn như mật khẩu, tên người dùng của bạn và các câu trả lời bảo mật. Tuy nhiên, trên thực tế, bạn đang tạo ra một lượng lớn dữ liệu khác như thời gian đăng nhập và vị trí ngày tháng của bạn, trình duyệt được sử dụng và địa chỉ IP. Dữ liệu này thường chỉ được lưu trữ vì các lý do pháp lý và hiếm khi được sử dụng.

Đây được gọi là Dark data, dù là dữ liệu thực và hữu ích, nhưng thường bị đánh giá thấp hoặc đơn giản là không đáng lưu tâm vì một số lý do. Tuy nhiên, đây hoàn toàn không phải là những thông tin “rác” mà chính là dữ liệu cho phép các tổ chức, doanh nghiệp phân tích sâu hơn về đối tượng mục tiêu, đồng thời có thể tăng hiệu quả kinh doanh lên đáng kể.

Tầm quan trọng của Dark data với doanh nghiệp

Có được thông tin chi tiết chưa được khai thác

Về lâu dài, hoạt động kinh doanh không thể thành công nếu doanh nghiệp không tiến hành thu thập và phân tích dữ liệu. Trên thương trường, người giành chiến thắng là người phân tích được nhiều dữ liệu hơn.

Nếu đối thủ cạnh tranh là những người đầu tiên tìm cách phân tích dark data, điều này có thể sẽ trực tiếp tác động tiêu cực hoặc làm cho doanh nghiệp của bạn mất đi những cơ hội. Do đó, việc triển khai các hệ thống phân tích trôi chảy tất cả dữ liệu có sẵn là vô cùng quan trọng.

Phát hiện lỗ hổng bảo mật

Việc lưu trữ liên tục dark data có thể khiến tổ chức gặp rủi ro, đặc biệt nếu dữ liệu này nhạy cảm. Trong trường hợp vi phạm, điều này có thể dẫn đến hậu quả nghiêm trọng. Đây có thể là vấn đề tài chính, pháp lý và có thể gây tổn hại nghiêm trọng đến danh tiếng của tổ chức.

Ví dụ: Vi phạm hồ sơ cá nhân của khách hàng có thể dẫn đến việc đánh cắp thông tin nhạy cảm, có thể dẫn đến đánh cắp danh tính. Một ví dụ khác có thể là vi phạm thông tin nhạy cảm của chính công ty, như liên quan đến nghiên cứu và phát triển. Những rủi ro này có thể được giảm thiểu bằng cách đánh giá và kiểm tra xem dữ liệu này có hữu ích cho tổ chức hay không, sử dụng mã hóa và bảo mật mạnh mẽ và cuối cùng, nếu nó được xác định là loại bỏ, thì nó nên được loại bỏ theo cách mà nó trở nên không thể thu hồi được.

Tối ưu hóa lưu trữ dữ liệu

Dữ liệu tối bao gồm nhiều loại dữ liệu và nội dung, bao gồm dữ liệu nhân viên cũ và tệp nhật ký, chẳng hạn như hệ thống, máy chủ và giao dịch khách hàng; thông tin hồ sơ khách hàng như dữ liệu vị trí địa lý; báo cáo tài chính; thư điện tử; giám sát và video khác; và bản nháp tài liệu hoặc bản trình bày cũ…

Sự hiện diện và tăng trưởng của dark data đặt ra thách thức quan trọng cho doanh nghiệp về chi phí lưu trữ và quản lý. Theo New York Times, 90% năng lượng được sử dụng bởi các trung tâm dữ liệu bị lãng phí. Nếu dữ liệu không được lưu trữ, chi phí năng lượng có thể được tiết kiệm, và chi phí này khá lớn. Vậy nên các tệp cũ không còn được sử dụng nên được loại bỏ khỏi hệ sinh thái lưu trữ của doanh nghiệp. 


Ngay cả những dữ liệu được lưu trữ và không bao giờ được sử dụng nữa vẫn chiếm dung lượng trên các máy chủ, và tiêu hoa rất nhiều năng lượng điện.
Ngay cả những dữ liệu được lưu trữ và không bao giờ được sử dụng nữa vẫn chiếm dung lượng trên các máy chủ, và tiêu hoa rất nhiều năng lượng điện.

Công dụng của dark data là gì?

Một công dụng rất quan trọng của dark data là vai trò của nó trong việc thúc đẩy các giải pháp do AI hỗ trợ - nhiều dữ liệu hơn sẽ làm tăng lượng thông tin mà AI có thể phân tích và sẽ cho phép các công cụ AI tạo ra những thông tin chi tiết sâu sắc hơn, chính xác hơn.

Rất nhiều trường hợp có thể sử dụng dark data, một trong những chiến lược lớn nhất là tạo ra và phát triển các chiến lược kinh doanh doanh nghiệp mới và hiệu quả hơn. Trong đó, bao gồm việc giúp các tổ chức xác định bộ phận nào trong tổ chức sở hữu dữ liệu nào, loại dữ liệu nào thuộc sở hữu của cấp quản lý và lãnh đạo, đồng thời họ nên sở hữu dữ liệu nào…

Dark data cũng có thể được sử dụng để cải tiến các quy trình; phát hiện và sửa lỗi quy trình; tìm kiếm các lỗ hổng bảo mật và các vi phạm tuân thủ tiềm ẩn…

Ví dụ: Chủ các cửa hàng hiếm khi chú ý đến thời gian trung bình mà người mua sắm dành cho việc xếp hàng. Thế nhưng nghiên cứu của Tập đoàn Omnicom đã chỉ ra chỉ số đó cực kỳ quan trọng, thông thường những người phải đứng xếp hàng từ 6 phút trở lên, có đến 56% không quay lại cửa hàng đó.

Hay dark data cũng rất hữu ích trong việc giám sát nhân viên, giúp tối ưu hóa trong công việc. Ví dụ, thông qua phân tích dark data, một mạng lưới các hiệu thuốc đã phát hiện nhân viên của họ bắt đầu làm việc muộn hơn và kết thúc công việc sớm hơn gần 20 phút, đồng thời, lạm dụng thời gian nghỉ giải lao nhiều hơn. Tổng cộng, thời gian làm việc đã bị tổn thất tới 10%.

Trong tương lai, dark data có thể được sử dụng để tạo ra các chiến lược quản lý dữ liệu mới, xung quanh các công nghệ đang phát triển nhanh chóng chẳng hạn IoT, đồng thời cung cấp thông tin cho việc phân tích các xu hướng ngắn hạn và dài hạn...

Đặc biệt, trong một số trường hợp, dark data có thể sử dụng trong chăm sóc sức khỏe. Bởi nhu cầu về tính hiệu quả - cũng như bức tranh dữ liệu đầy đủ và các phương pháp tiếp cận sáng tạo - là vô cùng quan trọng đối với chăm sóc sức khỏe, việc giải phóng sức mạnh của dark data sẽ có tác động to lớn và bên lâu đối với ngành chăm sóc sức khỏe.

Việc sử dụng dữ liệu hiệu quả hơn có thể giúp các bệnh viện, văn phòng bác sĩ và chuyên gia cá nhân hóa các thông tin y tế của bệnh nhân, dẫn đến việc chăm sóc tốt hơn và cải thiện bảo mật dữ liệu y tế cá nhân.


Dữ liệu là một tài sản kinh doanh ngày càng có giá trị và các doanh nghiệp sẽ cần con người, quy trình và công nghệ để quản lý và tối ưu giá trị tất cả.
Dữ liệu là một tài sản kinh doanh ngày càng có giá trị và các doanh nghiệp sẽ cần con người, quy trình và công nghệ để quản lý và tối ưu giá trị tất cả.

Bắt đầu phân tích dark data từ đâu?

Gần như mọi tổ chức đều hiểu rằng dữ liệu đang thúc đẩy tất cả, từ phát triển sản phẩm và chuỗi cung ứng đến trải nghiệm khách hàng đến chiến lược kinh doanh tổng thể, ở một mức độ chưa từng có. Tuy nhiên, nhiều lãnh đạo doanh nghiệp ngày nay không được chuẩn bị đầy đủ cho cuộc cách mạng này. Điều này đặt ra một thách thức cho các tổ chức, nhưng cũng lại là những cơ hội.

Dưới đây là các khuyến nghị cho các doanh nghiệp đang cố gắng tiến đến một tương lai dựa trên dữ liệu.

Chuẩn bị cho AI 

Luôn cập nhật các công nghệ đang phát triển như AI và học máy (machine learning), đồng thời tìm ra các trường hợp phù hợp để áp dụng cho ngành và tổ chức của bạn. Bên cạnh đó, các nhà lãnh đạo doanh nghiệp và công nghệ thông tin (CNTT) nên theo dõi sự phát triển chung của AI và hiểu cách các công nghệ này đang phát triển trên các thị trường khác nhau.

Ngoài ra, hãy xem xét tiềm năng tự động hóa để tạo ra hiệu quả và độ chính xác cao hơn, đồng thời trau dồi khả năng làm việc hiệu quả với khối lượng lớn dữ liệu.

Xây dựng văn hóa lấy dữ liệu làm trung tâm 

Tạo cơ sở hạ tầng cần thiết sẽ là bước đầu tiên để biến tương lai theo hướng dữ liệu thành hiện thực. Từ đó, thực hiện các bước để hiểu dữ liệu và sử dụng dữ liệu như một phần quan trọng trong chiến lược kinh doanh của bạn. Bạn cũng sẽ cần đưa tự động hóa và AI vào lộ trình CNTT của mình, đồng thời đưa dữ liệu và phân tích vào quá trình đưa ra quyết định chiến lược.

Tập trung tuyển dụng các kỹ năng dữ liệu mới

Do sự thiếu hụt kỹ năng dữ liệu trong toàn ngành, bạn sẽ cần tăng cường tuyển dụng nhân tài dữ liệu mới. Điều đó có nghĩa là tạo ra một nguồn nhân lực như cộng tác với các trường đại học, cao đẳng, tham gia các hội chợ việc làm, các buổi gặp mặt công nghệ và các sự kiện khác…

Sở hữu những người lao động có kỹ năng, hiểu biết về dữ liệu sẽ giúp tổ chức của bạn nổi bật hơn các đối thủ cạnh tranh. Hãy đảm bảo nâng tầm tổ chức của bạn như một doanh nghiệp có tư duy đi đầu để thu hút và giữ chân những nhân tài hàng đầu.

Cung cấp các cơ hội đào tạo 

Việc đảm bảo các nhân viên hiện tại được đào tạo những kỹ năng cần thiết để theo kịp các công nghệ mới sẽ giúp chuyển đổi doanh nghiệp của bạn. Cung cấp cơ hội phát triển bằng cách hợp tác với các trang web học trực tuyến hay cử nhân viên đến các hội nghị và sự kiện, đồng thời cung cấp các khoản hỗ trợ chi phí học tập…

Hãy khuyến khích nhân viên của bạn chịu trách nhiệm về các mục tiêu phát triển nghề nghiệp của riêng họ, sau đó cung cấp cho họ công cụ để biến các mục tiêu thành hiện thực.

Lời kết

Qua bài viết trên, hy vọng bạn đọc đã hiểu được Dark Data là gì và tầm quan trọng cảu Dark Data đối với doanh nghiệp. Hãy theo dõi các bài viết khác trên website Meeyland.com để cập nhật thêm những thông tin hữu ích nhé!

Theo: Reatimes.vn
Copy link
Chia sẻ:

Cùng chủ đề

Việc mất 10 tiếng để làm được AI hoàn thành trong 10 giây: Các sinh viên tài chính ngân hàng chuẩn bị mất việc?

Bitcoin trở thành tài sản có giá trị lớn thứ 8 toàn cầu

Mặt trái của AI: Tiêu thụ điện năng ở mức khổng lồ

Kỷ nguyên công nghệ gia tăng áp lực cạnh tranh giữa các doanh nghiệp bất động sản

Hé lộ 3 kênh podcast ‘giải ngố đầu tư’ dành cho người mới bắt đầu

Top 5 bóng hồng quyền lực trong làng công nghệ thế giới

5 tiêu chí tham gia cơ chế thử nghiệm cho vay ngang hàng - P2P Lending

Gen Z “sống chất” với phong cách tài chính 4.0: Luôn biết cách “tích tiểu thành đại”, “xung phong” lan tỏa tài chính số

Tin mới cập nhật

Xây dựng Hòa Bình (HBC) báo lãi hơn 57 tỷ đồng quý I/2024 sau 5 quý liên tiếp thua lỗ

3 giờ trước

Chuyên gia lý giải chuyện giá căn hộ Hà Nội tăng như “lên đồng”

3 giờ trước

Trung Quốc “mở đường” cho doanh nghiệp IPO tại Mỹ sau thời gian 2 năm gián đoạn

7 giờ trước

Chuyên gia Savills: Người mua nhà cần thận trọng trước “đòn tâm lý” của môi giới bất động sản

7 giờ trước

Nền kinh tế số Việt Nam tăng trưởng mạnh nhất Đông Nam Á

11 giờ trước