Open data là gì? Nó mang lại những lợi ích gì?
BÀI LIÊN QUAN
Top 11 Ngôn ngữ lập trình big data phổ biến nhất hiện nayXu hướng của Big Data hiện nay và những loại dữ liệu phổ biếnTìm hiểu về các tài liệu học Big data và lộ trình học cơ bản1. Open data là gì?
Open data, hay tạm dịch là dữ liệu mở, đó là loại dữ liệu có thể được sử dụng một cách rộng rãi, bởi bất kỳ ai mà không cần phải xin bản quyền hay giấy phép để sử dụng chúng.
Thông thường, dữ liệu mở sẽ là nhóm dữ liệu về thống kê định kỳ về sức khỏe cộng đồng, môi trường, giáo dục, v.v... Và nhóm dữ liệu này có nhiệm vụ để phục vụ cho việc phát triển chung của cộng đồng.
Định nghĩa dữ liệu mở theo Nghị định số 47/2020/NĐ-CP ngày 09/4/2020 đã đưa ra định nghĩa “Dữ liệu mở của cơ quan nhà nước: là dữ liệu được cơ quan nhà nước có thẩm quyền công bố rộng rãi cho cơ quan, tổ chức, cá nhân tự do sử dụng, tái sử dụng, chia sẻ”. Dù định nghĩa theo cách nào thì dữ liệu mở luôn đảm bảo được 2 đặc trưng là: khả năng sẵn sàng và khả năng tiếp cận dễ dàng.
Lưu ý tránh các sai lầm phổ biến như:
- Cần hiểu rằng dữ liệu mở là dữ liệu có bản quyền, tránh nghĩ rằng miễn phí nghĩa là không có bản quyền.
- Việc tự do sử dụng gồm yếu tố miễn phí nhưng không chỉ là miễn phí vì có một số dữ liệu được sử dụng miễn phí nhưng không phải là dữ liệu mở.
- Dữ liệu mở ở đây không đề cập đến các dữ liệu của cá nhân và các dữ liệu có liên quan đến bí mật quốc gia. Các dữ liệu này không nằm ở trong phạm vi khi nói đến dữ liệu mở.
2. 3 tiêu chí để của một Dữ liệu mở (Open data)
- Tính sẵn có và quyền truy cập
Dữ liệu có thể được truy cập một cách dễ dàng và không phải mất bất kỳ chi phí nào cho việc sử dụng. Và dữ liệu thường phải nằm ở dạng dễ sử dụng, dễ tìm thấy và thông thường được tải xuống trên máy tính hay điện thoại.
- Tái sử dụng và phân phối lại
Nhóm dữ liệu mở phải có khả năng sử dụng lại và được cho phép kết hợp với những nhóm dữ liệu khác mà không bị chịu sự kiểm soát nào.
- Có thể truy cập ở quy mô toàn cầu
Tất cả người dùng ở tất cả các địa phương đều có khả năng sử dụng dữ liệu mở, không bất kể một nhóm đối tượng nào cả.
3. Lợi ích của Dữ liệu mở
- Thúc đẩy sự phát triển của xã hội
Việc cung cấp dữ liệu mở rộng rãi cho tất cả các đối tượng người dùng giúp cho các công ty, tổ chức có số liệu chính xác để phản ánh tình trạng xã hội trong quá khứ và hiện tại, từ đó sẽ giúp đưa ra các định hướng phát triển trong tương lai.
Dữ liệu mở không chỉ tác động đến các ngành như thương mại, dịch vụ mà nó còn liên quan đến y tế, giáo dục hay khoa học…
- Đưa ra các số liệu minh bạch cho người dân
Thông qua dữ liệu mở (open data) được cung cấp bởi các cơ quan có thẩm quyền, người dân có thể tiếp cận được những số liệu chính xác, từ đó tránh các thông tin sai lệch.
- Tăng hiệu quả hoạt động cho các cơ quan và tổ chức
Các doanh nghiệp, tổ chức sẽ có khả năng sử dụng các số liệu ở trong nhiều lĩnh vực khác nhau như để khảo sát thị trường và giúp cho họ có kế hoạch phát triển phù hợp hơn trong thời gian tới. Cũng nhờ vậy mà các doanh nghiệp này sẽ hạn chế được việc thua lỗ trong quá trình kinh doanh.
4. Các nguồn Dữ liệu mở phổ biến
- Chính phủ
Đây có lẽ là nguồn dữ liệu mở được phổ biến nhất đối với người dân nói chung bởi đây là các số liệu báo cáo về các hoạt động diễn ra xung quanh ta, chẳng hạn như về dân số, tỉ lệ sinh hay đặc biệt trong thời điểm dịch bệnh Covid-19 vừa qua là số ca bệnh Covid-19 trong nước cũng như toàn thế giới.
Quy định của Nhà nước Việt Nam về hoạt động cung cấp dữ liệu mở, theo quy định tại Điều 17 Nghị định số 47/2020/NĐ-CP hoạt động cung cấp dữ liệu mở cần tuân thủ các nguyên tắc sau :
+ Dữ liệu mở phải toàn vẹn và phản ánh được đầy đủ nội dung thông tin cơ quan nhà nước cung cấp;
+ Là dữ liệu luôn được cập nhật mới nhất;
+ Phải có khả năng truy cập sử dụng được trên môi trường mạng internet;
+ Đảm bảo khả năng thiết bị số có thể gửi, nhận, lưu trữ hay là xử lý được;
+ Tổ chức, cá nhân được tự do truy cập sử dụng dữ liệu mở và không yêu cầu khai báo định danh khi khai thác và sử dụng dữ liệu mở;
+ Dữ liệu mở ở định dạng mở;
+ Sử dụng dữ liệu mở là miễn phí;
+ Ưu tiên cung cấp dữ liệu mở đối với dữ liệu mà người dân, doanh nghiệp đang có nhu cầu sử dụng cao.
- Lĩnh vực khoa học
Các dữ liệu mở có từ ngành khoa học sẽ là nền tảng cho những nghiên cứu sau này, từ đó sẽ thúc đẩy sự phát triển của ngành khoa học, và cũng nhờ đó sẽ giúp nâng cao chất lượng cuộc sống.
- Tổ chức phi lợi nhuận
Dữ liệu mở được cung cấp bởi các tổ chức phi lợi nhuận mà không thu lại bất kỳ lợi nhuận nào từ chính hoạt động này.
5. Ứng dụng dữ liệu mở (open data) tại các quốc gia
Theo nguồn open data handbook, dữ liệu mở đã mang lại rất nhiều giá trị cho các quốc gia. Tại Đan Mạch, sau 8 năm xây dựng từ năm 2002 thì nguồn địa chỉ mở đã có khoảng hơn 1.000 doanh nghiệp và tổ chức sử dụng, đem lại giá trị trực tiếp ít nhất 62 triệu Euro. Tại Anh, một nhân viên chỉ mất 15 phút để có thể giúp Chính phủ Anh tiết kiệm được hàng triệu bảng Anh nhờ vào việc phát hiện những khoản chi trùng lặp trong dữ liệu chi tiêu công của chính phủ. Dữ liệu mở (open data) cũng giúp việc quản lý nguồn cứu trợ của những tổ chức phi chính phủ hiệu quả hơn ở Nepal.
Theo nguồn data.gov.vn, chính phủ Nhật Bản đã triển khai các Dữ liệu mở (open data) liên quan đến thiên tai. Cụ thể là: Thông tin về thiên tai và thông tin hỗ trợ thảm họa dựa trên hệ thống thông tin địa lý đã được cung cấp trên web “sinai.info” được cộng đồng chung tay xây dựng và phát hành chỉ 4 giờ sau khi trận động đất xảy ra; Một cộng đồng các công ty công nghệ đã sử dụng kỹ thuật để hỗ trợ ứng phó; Có hơn 50 các ứng dụng đã được xây dựng và đăng tải trên các trang web, các kho ứng dụng iOS, Android liên quan đến vấn đề về thiên tai.
Để có thể xây dựng và tập hợp các bộ dữ liệu mở (open data) cần phải có một quá trình lâu dài. Xu hướng chung trong quá trình xây dựng dữ liệu mở tại nhiều quốc gia đó là tập trung vào hình thành các bộ dữ liệu rất quan trọng và mang lại các lợi ích cho đa số người dân với mục tiêu hoàn thành nhanh với dữ liệu đầy đủ nhất có thể. Ví dụ như những bộ dữ liệu về dữ liệu địa lý, đơn vị hành chính và cụ thể địa chỉ (chi tiết đến tọa độ, đường phố) sẽ hỗ trợ cho rất nhiều các lĩnh vực khác như thương mại điện tử, giao thông vận tải và xây dựng quy hoạch,v.v...
Tại Việt Nam cũng đã thực hiện triển khai xây dựng các bộ dữ liệu mở và cần tiếp tục thực hiện cũng như mở rộng ra nhiều lĩnh vực khác.
Lời kết
Vừa rồi là những thông tin của chúng tôi về dữ liệu mở (open data). Hy vọng bài viết này hữu ích với bạn, cảm ơn bạn đã theo dõi, hẹn gặp lại trong những bài viết khác!