Data products là gì? 11 vấn đề kinh doanh data products có thể giải quyết
BÀI LIÊN QUAN
Database marketing là gì? Vai trò của Database Marketing trong Digital MarketingDatabase (DB) là gì? Những ứng dụng Database phổ biến nhấtDatabase management system (DBMS) là gì? Chức năng của DBMSData products là gì?
Data products là một ứng dụng hay công cụ sử dụng dữ liệu nhằm giúp doanh nghiệp cải thiện các quyết định và quy trình của họ. Data products cung cấp giao diện thân thiện giúp người dùng có thể sử dụng khoa học dữ liệu cho các nhiệm vụ phân tích dự đoán, mô hình hóa dữ liệu mô tả, khai thác dữ liệu, học máy, quản lý rủi ro… mà không cần là nhà khoa học dữ liệu.
Đạt được mục tiêu kinh doanh là động lực của mọi công ty. Tuy nhiên điều này chỉ có thể đạt được thông qua các quyết định sáng suốt dựa trên thông tin chi tiết từ data products. Với data products, lợi thế cạnh tranh doanh nghiệp sẽ được nâng cao nhờ khả năng cải thiện dịch vụ hoặc sản phẩm theo dữ liệu thu thập từ khách hàng, từ hành vi truy cập trang web của khách hàng, từ khảo sát và các dữ liệu khác.
Ví dụ về data products
Các ví dụ phổ biến về data products có thể kể đến như Einstein AI của Salesforce - sản phẩm cung cấp phân tích dự đoán khách hàng, Bloomberg Terminal - phần mềm theo dõi và phân tích dữ liệu thị trường tài chính theo thời gian thực, hay Google Analytics - công cụ phân tích trang web...
Tuy nhiên, đối với một công ty, các ứng dụng dữ liệu hữu ích không nhất thiết phải ở cấp độ doanh nghiệp. Thông thường, họ cũng phát triển data products nội bộ nhằm đảm bảo tính riêng tư, toàn vẹn của dữ liệu và khả năng tương thích. Các ứng dụng dữ liệu càng linh hoạt và có thể tùy chỉnh sẽ càng có giá trị trong một tổ chức.
Với sự kết hợp giữa data products tuyệt vời với chiến lược kinh doanh và văn hóa doanh nghiệp, một công ty sẽ giải phóng được các nguồn nhân lực. Đặc biệt là trong thao tác chuẩn bị, làm sạch và phân tích dữ liệu thường tiêu tốn nhiều thời gian và công sức.
Ví dụ, trong phân tích tài chính, vốn là việc làm thủ công và tốn thời gian, Tableau Prep sẽ giúp các nhà phân tích tài chính đẩy nhanh quá trình xử lý và dành thời gian để tìm kiếm thông tin insight tốt hơn. Sản phẩm này đủ linh hoạt để có thể tùy chỉnh trong nhiều ngành khác nhau dưới nhiều vai trò khác nhau.
Sự khác biệt giữa “Data as a Product” và “Data Product”
Hai khái niệm được hiểu nôm na là Dữ liệu dưới dạng sản phẩm (Data as a Product) và Sản phẩm dữ liệu (Data Product). Thực chất chúng không hề giống nhau. Data product là bất kỳ sản phẩm hay tính năng kỹ thuật số nào sử dụng dữ liệu để hỗ trợ cho mục tiêu cuối cùng. Và, Data as a Product (DaaP) là một tập hợp con của sản phẩm dữ liệu.
“Data as a Product” là khái niệm áp dụng cho các nguyên tắc phát triển sản phẩm (Xác định và giải quyết các nhu cầu chưa được đáp ứng, tính linh hoạt, khả năng lặp lại và khả năng sử dụng lại) cho các dự án dữ liệu. Một số ví dụ về DaaP như xây dựng kho dữ liệu (data warehouse), phát triển API với mục đích lấy dữ liệu từ môi trường này sang môi trường khác…
3 loại data products
Dữ liệu dưới dạng dịch vụ
Tất cả các sản phẩm dữ liệu tạo ra doanh thu trực tiếp đều thuộc Data as a Service. Loại sản phẩm dữ liệu này cung cấp dữ liệu cho các nhu cầu cụ thể, chẳng hạn dữ liệu thị trường chứng khoán chính xác đến từng giây hay dữ liệu thời tiết theo từng khu vực cụ thể.
Sản phẩm dữ liệu nâng cao
Các sản phẩm dữ liệu có khả năng nâng cao sản phẩm vật lý hay ảo đều thuộc Data-Enhanced Products. Giá trị của sản phẩm đó thể hiện ở doanh thu (sự thay đổi về giá cả hoặc số lượng) của sản phẩm nâng cao. Hầu hết các đề xuất cho người dùng đều thuộc loại này, vì chúng giúp cải thiện hoạt động bán sản phẩm.
Dữ liệu dưới dạng Insight
Data as Insights bao gồm tất cả cách sử dụng dữ liệu để phân tích dữ liệu với mục đích cải thiện chất lượng và các vấn đề khác của sản phẩm. Do đó, khách hàng của loại sản phẩm dữ liệu này là khách hàng nội bộ và bản thân sản phẩm không tạo ra doanh thu. Google Analytics là một ví dụ.
11 vấn đề kinh doanh data products có thể giải quyết
1) Xếp các mục vào các lớp định trước
Hay còn được gọi là phân loại (classification) trong học máy.
Ví dụ: Dự đoán một bộ phim thuộc thể loại nào (kinh dị, hành động, hài...) dựa trên dữ liệu đánh giá của nó.
Các kỹ thuật đề xuất:
- Gradient Boosting (Tăng cường độ dốc): dễ sử dụng, hiệu suất tốt
- Neural networks (Mạng thần kinh): sử dụng cho các dữ liệu phi cấu trúc như văn bản, âm thanh hay hình ảnh
2) Ước tính một giá trị số tại một thời điểm cụ thể
Hay còn được gọi là hồi quy (regression). Các sản phẩm dữ liệu có khả năng dự đoán một số (số nguyên hoặc số có giá trị thực) dựa trên các đặc điểm.
Ví dụ: Dự đoán giá thị trường của một ngôi nhà dựa trên các đặc điểm như diện tích, vị trí, số phòng…
Các kỹ thuật đề xuất:
- Gradient Boosting (Tăng cường độ dốc): dễ sử dụng, hiệu suất tốt
- Neural networks (Mạng thần kinh): sử dụng cho các dữ liệu phi cấu trúc như văn bản, âm thanh hay hình ảnh
3) Dự đoán sự thay đổi của một giá trị trong tương lai
Hay còn được gọi là phân tích dãy số thời gian (time-series analysis) hay dự báo (forecasting). Khả năng này khác với khả năng số 2 vì nó hướng đến dự đoán nhiều điểm trong tương lai, chứ không chỉ một điểm duy nhất.
Ví dụ: Dự đoán diễn biến giá của một cổ phiếu sẽ diễn biến như thế nào mỗi ngày trong hai tháng tới.
Các kỹ thuật đề xuất:
- ARIMA (Mô hình chuỗi thời gian) và các biến thể
- Linear Model (Mô hình tuyến tính)
- Recurrent Neural Networks (Mạng thần kinh hồi quy): RNNs
4) Xếp các mục vào các nhóm tương tự
Hay còn được gọi là phân cụm (clustering) trong lĩnh vực khoa học dữ liệu.
Ví dụ: Nhóm người dùng thành các cụm tương tự bằng cách sử dụng dữ liệu về tuổi, giới tính, nguyên quán và thu nhập hàng năm để bạn có thể nhắm mục tiêu bằng các chiến dịch email khác nhau.
Các kỹ thuật đề xuất:
- K-means và các biến thể
- Expectation-Maximization (Cực đại hóa kỳ vọng)
5) Đề xuất sản phẩm cho người dùng
Khả năng này của data products giúp bạn giới thiệu cho người dùng những mục mà họ có khả năng tương tác nhiều hơn.
Ví dụ: Đề xuất phim cho những người xem hiện tại dựa trên lịch sử thích của những người xem tương tự trước đó.
Các kỹ thuật đề xuất:
- Collaborative Filtering (Lọc cộng tác)
- Phương pháp tiếp cận dựa trên mô hình: đào tạo mô hình học máy dựa trên các tính năng của người dùng
6) Tạo văn bản nhân tạo
Khả năng này giúp người dùng tạo văn bản có ý nghĩa, khi được cung cấp một số ngữ cảnh.
Ví dụ: Sử dụng chatbot để tương tác với khách hàng, phản hồi các tin nhắn và giải quyết các vấn đề đơn giản, Những trường hợp phức tạp hơn sẽ được máy chuyển cho người vận hành.
Các kỹ thuật đề xuất
- Recurrent Neural Networks: RNN, LSTM…
- Mô hình Transformer
7) Chọn chiến lược thay thế, hành động dựa trên phản hồi
Trước tiên, bạn cần vạch ra một chiến lược hay chính sách hướng đến đạt một mục tiêu cụ thể và có những điều chỉnh nếu nhận được phản hồi.
Ví dụ: Chuỗi chiến lược liên hệ, như gửi thư vào đầu tháng + tiếp tục gọi sau 5 ngày, có thể giúp tăng tỷ lệ chuyển đổi của chiến dịch truyền thông cho một đại lý ô tô.
Các kỹ thuật đề xuất:
- Thử nghiệm A/B
- Multi-armed Bandits
- Reinforcement learning (Học tăng cường)
8) Chọn chiến lược thay thế, hành động dựa trên dữ liệu hiện có
Tức là khả năng tìm ra chiến lược tối đa hóa/tối thiểu hóa một số số liệu dựa trên dữ liệu lịch sử.
Hay còn được gọi là Tối ưu hóa Toán học (Mathematical Optimization) hay Lập trình Toán học (Mathematical Programming).
Ví dụ: Xác định chính sách tối ưu để phát hành thẻ tín dụng dựa trên dữ liệu trong quá khứ sao cho lợi nhuận sau 5 năm đạt tối đa.
Các kỹ thuật đề xuất:
- Curve fitting (Thích hợp đường cong)
- Mô phỏng
- Bộ giải pháp: MS Excel, Thuật toán Simplex…
9) Phát hiện ngoại lai
Trong phát hiện ngoại lai, bạn có thể tự động phân tách các điểm dữ liệu khác biệt hoặc "kỳ lạ" khỏi những điểm thể hiện hành vi điển hình, bình thường.
Ví dụ: Bạn có dữ liệu kích chuột của nhiều người dùng đã từng truy cập trang web của bạn. Một cách tự động, bạn có thể lọc ra các phiên người dùng khác với tiêu chuẩn để các nhà phân tích có thể xem xét và xem liệu chúng có phải các truy cập tự động hay gian lận không.
Các kỹ thuật đề xuất:
- +/- 3 Độ lệch chuẩn đối dữ liệu một chiều
- Phân cụm K-means đối với dữ liệu đơn giản
- Thuật toán Isolation Forest đối với dữ liệu phức tạp hơn
10) Ước tính xác suất xảy ra sự kiện
Ước tính xác suất của một sự kiện giúp doanh nghiệp có thể suy luận về xác suất và xác định ngưỡng để hành động dựa trên điểm số. Hay còn được gọi là hồi quy hiệu chuẩn (calibrated regression).
Ví dụ: Chấm điểm rủi ro vỡ nợ để lựa chọn người cấp thẻ tín dụng, sau đó xác định ngưỡng rủi ro có dưới ngưỡng mà tổ chức sẽ cấp thẻ tín dụng hay không.
Các kỹ thuật đề xuất
- Hồi quy logistic
- Hồi quy hiệu chuẩn
11) Xếp hạng các mục ưu tiên cần sự tác động của con người
Trong trường hợp nguồn nhân lực hữu hạn và bạn muốn giao cho họ những nhiệm vụ cấp thiết nhất, khả năng này của data products vô cùng hữu ích.
Ví dụ: Xếp hạng các giao dịch mua hàng trực tuyến theo khả năng có thể xảy ra sự cố gian lận thành 10 trường hợp rủi ro nhất mỗi ngày và chuyển đến các nhà phân tích.
Các kỹ thuật được đề xuất: Mọi kỹ thuật hồi quy hay phân loại xác suất
Kết luận
Data products là sản phẩm lấy được giá trị từ dữ liệu thông qua insight hoặc dự đoán. Những sản phẩm này hiện diện trong cuộc hàng ngày của chúng ta, một trong số các ứng dụng của chúng đang được chúng ta sử dụng và không thể thiếu, đặc biệt đối với vấn đề kinh doanh.
Nói cách khác, nếu một công ty đang tìm giải pháp cải tiến các quy trình hoạt động thì điều cần thiết là họ phải tận dụng được các dữ liệu có lợi. Hy vọng bài viết đã cung cấp cho các bạn những thông tin hữu ích về Data products. Truy cập Meey Land để khám phá những thông tin thú vị về thế giới công nghệ!