meeyland app
Meey Land
Cổng thông tin bất động sản xác thực 4.0
Tải ứng dụng

Data type là gì? Tại sao chúng lại quan trọng?

Thứ hai, 19/12/2022-10:12
Data type được xem là nền tảng trong hầu hết, thậm chí có thể nói là tất cả các ngôn ngữ lập trình. Các kiểu dữ liệu được gán cho các giá trị nhằm đảm bảo các chức năng không bị lỗi và phù hợp của dữ liệu đó. 

Data Type là gì?

Data type, Kiểu dữ liệu, là một cách phân loại dữ liệu cho hệ thống máy tính biết cách diễn giải giá trị của nó. Việc hiểu các loại dữ liệu sẽ đảm bảo dữ liệu được thu thập ở định dạng ưa chuộng và giá trị mong đợi của từng thuộc tính.

Ví dụ, data type của “Ross, Bob” sẽ giúp máy tính trả lời câu hỏi:

  • Liệu dữ liệu có đề cập đến tên đầy đủ của ai đó (“Bob Ross”)
  • Hay đây là danh sách gồm hai tên (“Bob” và “Ross”)

Qua đó, giúp bạn đảm bảo rằng:

  • Dữ liệu bạn thu thập luôn ở định dạng phù hợp (“Ross, Bob” chứ không phải “Bob Ross”)
  • Giá trị mong đợi (“Ross, Bob” chứ không phải “R0$$, B0b”)

Lưu ý: Bạn không nên nhầm lẫn data type với customer data (dữ liệu khách hàng), tên gọi chung của entity data (dữ liệu tổ chức) và event data (dữ liệu sự kiện). Để xác định đúng thuộc tính sự kiện và thuộc tính tổ chức, bạn cần hiểu rõ về data type. Kế hoạch theo dõi được xác định rõ ràng phải chứa data type của mọi thuộc tính để đảm bảo độ chính xác và ngăn ngừa mất dữ liệu.


Data type là một cách phân loại dữ liệu cho hệ thống máy tính biết cách diễn giải giá trị của nó.
Data type là một cách phân loại dữ liệu cho hệ thống máy tính biết cách diễn giải giá trị của nó.

Data type phổ biến

Số nguyên (int)

Đây là kiểu dữ liệu số phổ biến nhất, chứa các số không có thành phần phân số. Ví dụ: -707, 0, 707

Số thực dấu phẩy động (floating point)

Floating point là kiểu dữ liệu số dùng để lưu trữ các số có thể có thành phần phân số giống như các giá trị tiền tệ. Ví dụ: 707.07, 0.7, 707.00

Ký tự (char)

Ký tự là chữ cái, chữ số, dấu chấm câu, ký hiệu hoặc khoảng trống. Ví dụ a, 1, !

Chuỗi (str hoặc văn bản)

Đây là một dãy các ký tự và kiểu dữ liệu được sử dụng phổ biến nhất trong lưu trữ văn bản. Ngoài ra, một chuỗi cũng có thể bao gồm các chữ số và ký hiệu, tuy nhiên, nhìn chung nó được coi là văn bản.

Số điện thoại thường được lưu dưới dạng chuỗi (+1-999-666-3333) nhưng cũng có thể được lưu dưới dạng số nguyên (9996663333).

Boolean (bool)

Boolean đại diện cho các giá trị đúng và sai, đôi khi một giá trị boolean cũng được biểu thị bằng 0 (đối với sai) và 1 (đối với đúng). 

Kiểu liệt kê (enum)

Enumerated type là một tập hợp các giá trị có thể có của 1 thuộc tính. Ví dụ về Giới tính thì có thể có Nam, Nữ, Gay, Less. Tình trạng hôn nhân của 1 người thì có thể là Độc thân, Đã đính hôn, Phức tạp, Đã kết hôn. 

Kiểu dữ liệu mặc định của Enum là số nguyên, trong đó phần tử đầu tiên sẽ có giá trị là 0 và các phần tử tiếp theo mặc định tăng lên 1. Ví dụ: giá trị đại diện cho Độc thân là 0, Đã đính hôn là 1, Phức tạp là 2 và Đã kết hôn là 3.

Mảng (Array)

Mảng (Array) là nơi cho phép lưu trữ nhiều giá trị theo thứ tự nhất định trong một biến duy nhất. Nó có thể chứa các giá trị với kiểu dữ liệu khác nhau như chuỗi, số, đối tượng... Chiều dài của Array có thể tự tăng lên hay giảm xuống mỗi khi chúng ta thêm hay xóa các phần tử trong mảng.

Vị dụ: chúng ta có nhiều biến như đoạn code sau

Data type là gì? Tại sao chúng lại quan trọng? - ảnh 2

Việc lưu trữ giá trị biến như ví dụ sẽ khiến bạn khó tìm kiếm, sử dụng và tốn bộ nhớ lưu trữ biến. Lúc này sử dụng mảng là giải pháp phù hợp. Kết quả là:

Data type là gì? Tại sao chúng lại quan trọng? - ảnh 3

Ngày

Không cần giải thích; Date thường lưu trữ một ngày ở định dạng YYYY-MM-DD (cú pháp ISO 8601). Ví dụ: 2022/12/30

Thời gian

Lưu trữ thời gian ở định dạng hh:mm:ss. Bên cạnh thời gian trong ngày, nó cũng có thể được sử dụng để lưu trữ thời gian đã trôi qua hoặc khoảng thời gian giữa hai sự kiện có thể dài hơn 24 giờ. Ví dụ: thời gian kể từ khi một sự kiện đã diễn ra có thể là hơn 72 giờ (72:00:59).

Ngày giờ

Datetime lưu trữ một giá trị chứa cả ngày và giờ ở định dạng YYYY-MM-DD hh:mm:ss. Ví dụ: 2022-12-28 12:00:59

Dấu thời gian

Thường được biểu thị bằng thời gian Unix, timestamp biểu thị số giây đã trôi qua kể từ 00:00:00 UTC, ngày 1 tháng 1 năm 1970.

Các hệ thống máy tính thường sử dụng dấu thời gian để ghi ngày và giờ chính xác của sự kiện, đến cả số giây, ở định dạng không bị ảnh hưởng bởi múi giờ. Do đó, không giống như ngày giờ, dấu thời gian sẽ giữ nguyên bất kể vị trí địa lý của bạn. 

Data type nâng cao

  • Các mô hình lược đồ (Schema models): Một tập hợp các đối tượng cơ sở dữ liệu.
  • Object Relational Mapping (ORM): Mã tự động chuyển dữ liệu được lưu trữ trong các bảng Cơ sở dữ liệu quan hệ (Relational database) thành các đối tượng. Chúng có thể giúp ánh xạ các đối tượng mã vào cơ sở dữ liệu của bạn.

Ví dụ

Các ngôn ngữ lập trình khác nhau cung cấp các data type khác nhau, cho nhiều mục đích sử dụng khác nhau. Tuy nhiên, các data type được sử dụng phổ biến nhất mà bạn cần chú ý là 11 loại kể trên. 

Trong biểu mẫu đăng ký tiêu chuẩn, mỗi trường sẽ chấp nhận giá trị của một kiểu dữ liệu cụ thể. 

  • Trường văn bản lưu đầu vào dưới dạng chuỗi trong khi trường số thường chấp nhận số nguyên. 
  • Tên và địa chỉ email luôn ở dạng chuỗi, trong khi các số có thể được lưu trữ dưới dạng kiểu số hoặc chuỗi vì chuỗi là một tập hợp các ký tự bao gồm các chữ số.

Trong các trường có một tùy chọn hay nhiều tùy chọn xác định trước, các kiểu dữ liệu liệt kê và mảng sẽ phát huy tác dụng. 


 
 

Ví dụ trong biểu mẫu đăng ký Facebook ở trên

  • Trường Sinh nhật có 3 trường con, mỗi trường kiểu liệt kê yêu cầu bạn chọn một tùy chọn cho ngày, tháng và năm tương ứng. 
  • Trường Giới tính yêu cầu bạn chọn từ hai lựa chọn cho trước hoặc thêm một lựa chọn tùy ý, đầu vào của chúng sẽ được lưu trữ dưới dạng chuỗi. 
  • Các chuỗi như mật khẩu luôn được băm hoặc mã hóa.

Ứng dụng của data type

Hiểu về data type rất quan trọng trong việc giúp bạn tận dụng dữ liệu khách hàng (data customer), để thu thập dữ liệu rõ ràng và nhất quán.

Thiết bị đo lường (Instrumentation)

Quá trình theo dõi dữ liệu hành vi (behavioral data) từ các nguồn dữ liệu chính và đồng bộ hóa dữ liệu với hệ thống lưu trữ bên trong hoặc bên ngoài được gọi là thiết bị đo.

Bước đầu tiên trong quy trình Instrumentation là tạo kế hoạch theo dõi dữ liệu. Khi quyết định những sự kiện nào cần theo dõi và những thuộc tính nào cần thu thập (cả thuộc tính sự kiện và tổ chức), việc chỉ định loại dữ liệu của từng thuộc tính trong kế hoạch theo dõi giúp quy trình hiệu quả hơn rất nhiều và ít khả năng xảy ra lỗi.

Điều này đặc biệt hữu ích cho các kỹ sư được giao nhiệm vụ triển khai. Bằng cách đảm bảo rằng mỗi thuộc tính được gửi kèm loại dữ liệu chính xác, có thể tránh được sự không nhất quán của dữ liệu.

Khảo sát (Surveys)

Các câu hỏi trong một cuộc khảo sát có thể là câu hỏi mở (văn bản hoặc số) hoặc đi kèm với các lựa chọn cho trước như drop-down list (enum), checkboxes (mảng), nút tuỳ chọn (boolean) hoặc thậm chí là thanh trượt

Để lưu trữ dữ liệu từ các khảo sát (trong cơ sở dữ liệu hoặc hệ thống của bên thứ ba), bạn cần chỉ định tên thuộc tính (ngành_tên, nghề nghiệp_chức vụ, hủy_lý do, có/không_hài lòng, v.v.) và kiểu dữ liệu của nó (chuỗi, số, boolean, v.v.). Tên thuộc tính lưu trữ giá trị đã nhập và kiểu dữ liệu xác thực rằng giá trị mong đợi.

Như vậy, dữ liệu sẽ có sự nhất quán và giúp việc phân tích và kích hoạt dữ liệu trở nên dễ dàng hơn. Nên nhớ rằng các câu hỏi mở sẽ khiến việc phân tích khó khăn hơn vì bạn không thể tổng hợp các câu trả lời trừ khi bạn chuyển đổi dữ liệu bằng cách phân tích cú pháp từng câu trả lời và trích xuất văn bản phù hợp với quy tắc.

Với các lựa chọn cho trước, việc phân tích trở nên đơn giản và không bị ảnh hưởng ngay cả khi bạn thay đổi các lựa chọn ở giai đoạn sau.

Việc áp dụng kiến ​​thức của về Data Type không chỉ dừng lại trong việc thu thập dữ liệu hay thiết bị đo, các hoạt động như quản lý dữ liệu, tích hợp dữ liệu và phát triển ứng dụng nội bộ (sử dụng các công cụ không có mã hoặc ít mã) cũng sẽ trở nên dễ dàng hơn rất nhiều.

Tầm quan trọng của data type

Mỗi ngôn ngữ lập trình đều có một hệ thống data type. Nếu không, máy tính sẽ không biết cách để thể hiện dữ liệu trong chương trình; đồng thời không biết lấy kiểu dữ liệu nào hay thêm kiểu dữ liệu nào, thậm chí nó cũng không biết cách lưu trữ những dữ liệu ở đâu. 

Chẳng hạn, bằng cách định nghĩa một biến là số nguyên, máy tính sẽ biết rằng cần bao nhiêu byte để đại diện cho giá trị này và đặc biệt là biết được cách thực hiện các phương thức trên dữ liệu đó. Nói cách khác, cách duy nhất để máy tính biết cách xử lý dữ liệu chính là cho chúng biết data type mà chúng phải xử lý.

Việc hiểu kiểu dữ liệu và biết cách thể hiện chúng mang lại cho chúng ta những lợi ích to lớn, như:

  • Chúng ta sẽ có những chương trình hiệu quả hơn nhờ việc tối ưu được bộ nhớ và nơi lưu trữ. Bằng cách biết rằng một mảng của số nguyên tốn ít không gian hơn một mảng của số lẻ, giúp bạn tiết kiệm được hàng kilobytes thậm chí là megabyte.
  • Việc hiểu được data type sẽ giúp chúng ta giải mã được những "con bug" và những vấn đề liên quan đến kiểu dữ liệu. Ví dụ khi chương trình báo lỗi không thể cộng hai số vì một trong hai là kiểu chuỗi, bạn sẽ hiểu được lý do tại sao và giúp bạn tránh mắc những lỗi tương tự.
  • Khi hiểu về cách kiểu dữ liệu hoạt động, bạn sẽ giống như Neo trong phim "The Matrix", người biết cách bẻ cong những quy tắc.

Data type phổ biến trên tất cả các ngôn ngữ lập trình, dù cách thức mà các ngôn ngữ lập trình xử lý chúng có sự khác biệt. Chúng hoạt động như một thuộc tính hướng dẫn máy tính cách diễn giải dữ liệu. Hy vọng bài viết trên đã giúp bạn hiểu rõ hơn về data type và có thêm nhiều kiến thức trong việc lựa chọn ngôn ngữ lập trình trong dự án kế tiếp. Cảm ơn bạn đã dành thời gian đọc bài viết này, nếu thấy nội dung hữu ích hãy chia sẻ cho nhiều người biết hơn nhé!

Theo: Reatimes.vn
Copy link
Chia sẻ:

Cùng chủ đề

Meey Group chia sẻ kinh nghiệm về proptech tại Hội nghị Thượng đỉnh Khoa học và Kinh tế toàn cầu

Chủ nhân giải VinFuture 2024 khuyên người trẻ chấp nhận rủi ro và luôn tò mò

Liên danh FPT Nha Trang muốn làm khu đô thị công nghệ rộng hơn 50ha tại "hòn ngọc biển Đông"

Từng chỉ sống với 72 nghìn mỗi ngày, làm việc 100 giờ/tuần với 3 công việc: Nhiều năm sau "lội ngược dòng" thành doanh nhân thành đạt, nắm giữ khối tài sản tỷ đô

Mã độc lây lan qua Facebook có nguồn gốc từ Việt Nam NodeStealer lại “tái xuất giang hồ”

Ứng dụng AI trong “số hoá” bất động sản, Meey Group gây ấn tượng tại Diễn đàn Chuyển đổi số Hải Phòng 2024

Chưa thể cấm ngay Temu, 1688 và Shein, Bộ Công Thương và Tổng cục Thuế nói gì?

Mạng 5G lúc nhanh, lúc chậm: Viettel lý giải nguyên nhân?

Tin mới cập nhật

Giá nhà tăng cao, người dân nên hạ tiêu chuẩn để dễ tiếp cận

52 phút trước

Thị trường chung cư TP.HCM: Giao dịch chậm vì nhiều nhà đầu tư “kẹt vốn”

52 phút trước

Hà Nội duyệt quy hoạch đô thị có trường đua ngựa 420 triệu USD

52 phút trước

Coi chừng đầu tư chứng khoán qua AI

54 phút trước

TS. Vũ Đình Ánh: Có kiểu cho vay mua bất động sản nhưng "ẩn mình" dưới gói vay tiêu dùng

54 phút trước