meeyland app
Meey Land
Cổng thông tin bất động sản xác thực 4.0
Tải ứng dụng

Data fabric là gì? Những điều cần biết về kết cấu dữ liệu

Thứ năm, 24/11/2022-09:11
Data fabric được bình chọn là 1 trong 3 xu hướng về dữ liệu nổi bật nhất trong năm 2021. Data fabric có thể tận dụng tối đa những kỹ năng và các công nghệ tiên tiến hiện có từ các trung tâm dữ liệu, các kho dữ liệu và hồ dữ liệu đồng thời giới thiệu các phương pháp và các loại hình công cụ mới dành cho tương lai. Vậy Data Fabric là gì?

Khái niệm Data fabric là gì?

Data fabric hay Kết cấu dữ liệu là một dạng kiến trúc tạo điều kiện cho việc tích hợp đầu cuối của những đường ống dữ liệu khác nhau và các môi trường đám mây thông qua việc sử dụng những hệ thống công nghệ thông minh và tự động.

Trong nhiều thập kỷ gần đây, sự bứt phá phát triển mạnh mẽ của công nghệ điện toán đám mây, trí tuệ nhân tạo, Internet vạn vật (IoT) và công nghệ điện toán biên đã dẫn đến sự bùng nổ phát triển theo cấp số nhân của bia data (dữ liệu lớn), tạo ra những sự khó khăn, phức tạp hơn cho các đơn vị doanh nghiệp trong việc quản lý lưu trữ thông tin dữ liệu.

Điều này đã làm cho việc thống nhất dữ liệu và giám sát quản trị môi trường dữ liệu đã trở thành nhiệm vụ ưu tiên vì sự tăng trưởng này đã tạo nên những thách thức to lớn, đáng kể, chẳng hạn như các kho chứa dữ liệu quy mô lớn, rủi ro trong bảo mật và các nút thắt chung đối với việc đưa ra quyết định.

Các nhóm quản lý dữ liệu đang góp phần giải quyết những vấn đề khó khăn, thách thức này bằng những giải pháp kết cấu dữ liệu (data fabric). Họ đang tận dụng chúng để có thể tiến hành hợp nhất những hệ thống dữ liệu khác nhau, nhúng quản trị, tăng cường hiệu quả những biện pháp bảo mật an toàn và quyền riêng tư, đồng thời cung cấp thêm nhiều khả năng để truy cập vào các thông tin dữ liệu hơn cho những người lao động, đặc biệt là những người dùng ở trong doanh nghiệp của họ.

Những nỗ lực để tích hợp dữ liệu này sẽ thông qua những việc kết cấu thông tin dữ liệu cho phép đưa ra các quyết định chính xác toàn diện hơn, tập trung vào thông tin dữ liệu. Về mặt lịch sử, một đơn vị doanh nghiệp có thể có nhiều những nền tảng dữ liệu khác nhau phù hợp với những lĩnh vực ngành nghề kinh doanh cụ thể.

Ví dụ: người dùng có thể có nền tảng dữ liệu về nhân sự, nền tảng dữ liệu về các chuỗi cung ứng sản phẩm và nền tảng dữ liệu thông tin khách hàng, nền tảng này có chứa những loại hình dữ liệu trong những môi trường khác nhau và riêng biệt mặc dù có thể có những sự chồng chéo nhất định. Tuy nhiên, kết cấu dữ liệu có thể cho phép những người dùng dễ dàng đưa ra quyết định xem dữ liệu này một cách chặt chẽ hơn để hiểu rõ về vòng đời của khách hàng, tạo nên sự kết nối giữa các dữ liệu không tồn tại trước đó. Bằng cách thu hẹp khoảng cách trong sự hiểu biết, kiến thức của khách hàng, sản phẩm và quy trình vận hành, các kết cấu dữ liệu đã và đang thúc đẩy mạnh mẽ những sáng kiến trong tự động hóa và quá trình chuyển đổi kỹ thuật số hiện đại trong các đơn vị doanh nghiệp.


Data fabric là một dạng kiến trúc tạo điều kiện cho việc tích hợp đầu cuối của những đường ống dữ liệu
Data fabric là một dạng kiến trúc tạo điều kiện cho việc tích hợp đầu cuối của những đường ống dữ liệu

Kiến trúc của kết cấu dữ liệu

Không có một loại kiến trúc dữ liệu độc nhất cho một kết cấu dữ liệu vì những đơn vị doanh nghiệp khác nhau sẽ phát sinh những nhu cầu khác nhau trong công việc. Số lượng của các nhà cung cấp dịch vụ điện toán đám mây và triển khai hệ thống cơ sở hạ tầng dữ liệu khác nhau nhằm đảm bảo tuyệt đối về sự khác biệt, độc lập giữa các đơn vị doanh nghiệp.

Tuy nhiên, các đơn vị doanh nghiệp hiện nay sử dụng các loại khung dữ liệu này để nhằm thể hiện cụ thể những điểm chung trên các kiến trúc đặc trưng của họ, những điểm chung duy nhất đối với một loại hình kết cấu dữ liệu. Cụ thể hơn, chúng bao gồm có sáu loại thành phần cơ bản bao gồm như sau:

  • Data management layer: Đây là lớp kết cấu chịu trách nhiệm về việc quản trị dữ liệu và bảo mật thông tin dữ liệu.
  • Data Ingestion layer: Lớp này sẽ bắt đầu kết hợp những dữ liệu đám mây cùng với nhau, tìm kiếm tất cả những kết nối liên kết giữa dữ liệu có cấu trúc và dữ liệu phi cấu trúc.
  • Data processing: Lớp xử lý dữ liệu sẽ được tinh chỉnh dữ liệu để đảm bảo rằng chỉ có những loại hình dữ liệu có liên quan mới được hiển thị trên hệ thống để trích xuất dữ liệu.
  • Data Orchestration: Lớp này tiến hành một số những nhiệm vụ công việc quan trọng nhất đối với kết cấu dữ liệu — bao gồm có chuyển đổi, tích hợp và làm sạch các dữ liệu, giúp cho những nhóm khác nhau ở trên toàn doanh nghiệp đều có thể sử dụng được.
  • Data Discovery: Lớp này sẽ hiển thị rõ ràng những cơ hội mới để tích hợp lại những nguồn dữ liệu thông tin khác nhau. Ví dụ: nó có thể tìm cách thực hiện kết nối các dữ liệu ở trong chuỗi cung ứng của data mart và hệ thống dữ liệu quản lý các mối quan hệ khách hàng, tạo ra những cơ hội mới cho việc cung cấp thêm những loại hình sản phẩm phù hợp dành cho các khách hàng hoặc các phương án hiệu quả nhất để từ đó cải thiện tối đa sự hài lòng của các khách hàng.
  • Data Access: Lớp này cho phép tiêu thụ các thông tin dữ liệu, đảm bảo quyền phù hợp dành cho các nhóm nhất định để từ đó có thể tuân thủ các quy định cụ thể của chính phủ. Ngoài ra, lớp này cũng giúp hiển thị các dữ liệu có liên quan thông qua việc sử dụng các trang tổng quan và các loại hình công cụ trực quan hóa thông tin dữ liệu khác.

Kiến trúc dữ liệu mang đến nhiều lợi ích cho các doanh nghiệp
Kiến trúc dữ liệu mang đến nhiều lợi ích cho các doanh nghiệp

Những trường hợp sử dụng đến Data fabric (Kết cấu dữ liệu)

Trong hoạt động của các đơn vị doanh nghiệp, có rất nhiều những trường hợp sử dụng đến các yêu cầu cấu trúc dữ liệu có tốc độ cao, quy mô lớn sở hữu khả năng hỗ trợ hàng nghìn các giao dịch thực hiện cùng lúc đồng thời. Ví dụ:

  • Cung cấp một cái nhìn tổng quan 360 độ về khách hàng: Chân dung khách hàng toàn diện cho IVR có thể tự phục vụ, CRM, các cổng thông tin tự phục vụ của khách hàng (trên web hoặc qua di động), chatbot và đội ngũ kỹ thuật viên.
  • Tuân thủ luật về vấn đề bảo mật dữ liệu: Với quy trình làm việc linh hoạt và các giải pháp tự động hóa dữ liệu có thể điều phối được sự tuân thủ giữa mọi người, hệ thống và dữ liệu - được thiết kế bài bản khoa học để có thể giải quyết được những quy định trong hiện tại và tương lai
  • Liên kết dữ liệu doanh nghiệp vào các hồ dữ liệu và kho dữ liệu: Cho phép các kỹ sư dữ liệu có thể chuẩn bị và cung cấp thêm những loại thông tin dữ liệu mới, đáng tin cậy, hữu ích đến từ tất cả các nguồn, đến tất cả những mục tiêu một cách đơn giản, nhanh chóng và quy mô.
  • Cung cấp các loại hình dữ liệu được thử nghiệm dựa theo yêu cầu: Tạo ra kho dữ liệu thử nghiệm và cung cấp các loại hình dữ liệu thử nghiệm ẩn danh cho tất cả những người thử nghiệm và những đường ống CI/CD tự động.
  • Hiện đại hóa tất cả những hệ thống kế thừa: Di chuyển một cách bảo mật, an toàn thông tin dữ liệu từ những hệ thống kế thừa đi sang kết cấu dữ liệu, sau đó sẽ nghiên cứu sử dụng các kết cấu này để làm cơ sở dữ liệu hồ sơ cho những loại hình ứng dụng công nghệ mới được nghiên cứu, phát triển.
  • Bảo mật các thông tin giao dịch thẻ tín dụng: Bảo vệ các thông tin nhạy cảm của người chủ thẻ bằng cách thực hiện mã hóa và token các dữ liệu gốc để từ đó tránh tình trạng ăn cắp, vi phạm dữ liệu.
  • Dự đoán chính xác tình trạng gián đoạn, phát hiện ra những sự gian lận sai phạm của khách hàng, thực hiện việc chấm điểm tín dụng, v.v.

Những ưu điểm của Data fabric Architecture (kiến trúc kết cấu dữ liệu)

Mặc dù những loại kết cấu dữ liệu có thể cải thiện tối đa năng suất tổng thể là điều có thể thấy rõ ràng, nhưng những lợi ích dưới đây cũng đã phần nào chứng minh được giá trị kinh doanh cho những người sử dụng:

  • Tích hợp thông minh: Những kết cấu dữ liệu được sử dụng ở trong những semantic knowledge graph (biểu đồ tri thức ngữ nghĩa), quản lý giám sát về siêu dữ liệu và học máy để từ đó thống nhất các dữ liệu trên nhiều loại hình dữ liệu và điểm cuối khác nhau. Điều này góp phần hỗ trợ những nhóm quản lý dữ liệu trong việc thực hiện nhóm những bộ dữ liệu có liên quan mật thiết lại với nhau cũng như có khả năng tích hợp được những nguồn dữ liệu ròng mới vào trong các hệ sinh thái thông tin dữ liệu của các đơn vị doanh nghiệp. Chức năng này có thể tự động hóa những khía cạnh khác nhau của việc quản lý khối lượng công việc dữ liệu, từ đó dẫn đến việc tăng cường sự hiệu quả đã đề cập ở trên. Nhưng nó cũng góp phần giúp loại bỏ những lỗ hổng tồn tại trên các hệ thống dữ liệu, tập trung hóa những phương pháp quản trị dữ liệu và cải thiện tối đa chất lượng của dữ liệu tổng thể.
  • Bảo vệ các dữ liệu an toàn hơn: Việc mở rộng về quyền truy cập dữ liệu cũng không đồng nghĩa với việc làm ảnh hưởng đến những biện pháp bảo mật và quyền riêng tư an toàn của các dữ liệu. Trên thực tế, điều đó có nghĩa là hiện nay ngày càng có nhiều rào chắn mạnh mẽ hơn trong việc quản trị dữ liệu, giám sát một cách chặt chẽ trong việc kiểm soát truy cập, đảm bảo dữ liệu cụ thể chỉ có sẵn cho một số người dùng sở hữu vai trò nhất định. Kiến trúc kết cấu dữ liệu cũng cho phép các nhóm kỹ thuật và bảo mật triển khai mã hóa dữ liệu nhạy cảm và độc quyền, giảm thiểu rủi ro việc chia sẻ dữ liệu và vi phạm hệ thống.
  • Dân chủ hóa dữ liệu: Các kiến trúc kết cấu dữ liệu đã tạo điều kiện thuận lợi hơn cho những ứng dụng có khả năng tự phục vụ, mở rộng thêm các quyền truy cập dữ liệu ngoài. Việc giảm tắc nghẽn dữ liệu cũng được khắc phục tối đa, sau đó sẽ thúc đẩy tăng năng suất cao hơn, cho phép người dùng của doanh nghiệp có thể đưa ra những quyết định kinh doanh chính xác hơn, nhanh hơn và bằng cách giải phóng người dùng khỏi các các công việc lặp đi lặp lại và tập trung vào kỹ năng chuyên môn.

Data fabric là một lĩnh vực vô cùng phát triển hiện nay
Data fabric là một lĩnh vực vô cùng phát triển hiện nay

Data fabric (kiến trúc dữ liệu) là một trong những lĩnh vực công nghệ phát triển nhanh nhất hiện nay. Data fabric giúp quản trị, bảo vệ dữ liệu và tích hợp chúng một cách hiệu quả.

Theo: Reatimes.vn
Copy link
Chia sẻ:

Cùng chủ đề

Chiến lược mới của các Big Tech nhằm thâu tóm thị trường AI

Các “ông lớn” công nghệ gia tăng nỗ lực chinh phục thị trường Ấn Độ

Châu Âu ấp ủ xây dựng các trung tâm dữ liệu mới trên quỹ đạo

Lo ngại lộ dữ liệu, Mỹ tiếp tục mở cuộc điều tra ba nhà mạng của Trung Quốc

Hãng sản xuất pin đến từ Trung Quốc “trình làng” dòng pin mới với hiệu suất khủng

Trung tâm dữ liệu AI Cloud quy mô lớn đầu tiên của Đông Nam Á đi vào vận hành

Sau ChatGPT, những AI nào đang rục rịch được tích hợp vào iPhone?

Cuộc chạy đua trí tuệ nhân tạo ngày càng “nóng”, đối thủ lớn nhất của OpenAI công bố chatbot mạnh nhất

Tin mới cập nhật

Một số dự án treo bất ngờ được thoát "khai tử" nhờ Hà Nội tung "phao cứu sinh"

2 ngày trước

Quy định cấm bán bảo hiểm "gắn" dịch vụ ngân hàng: Doanh nghiệp bảo hiểm muốn có hướng dẫn cụ thể

2 ngày trước

Gặp khó với "danh phận", Condotel cắt lỗ cả tỉ đồng nhưng thanh khoản vẫn mất hút

2 ngày trước

Tập đoàn Foxconn tiếp tục rót thêm 551 triệu USD đầu tư phát triển công nghệ tại Việt Nam

2 ngày trước

Thương mại điện tử bùng nổ, nhà phố cho thuê đìu hiu, ế ẩm

3 ngày trước