Turing Test là gì? Máy móc có thể bị nhầm lẫn là con người không?
BÀI LIÊN QUAN
Lập trình iot là gì? Lập trình iot có ảnh hưởng như thế nào trong công nghệ hiện nay?Các dự đám về tương lai IoT bạn không nên bỏ lỡMột số ứng dụng IoT trong đời sống hằng ngàyTuring Test là gì?
Turing Test, phép thử Turing, là một phương pháp đơn giản để xác định liệu một cỗ máy có thể chứng minh nó có trí thông minh của con người hay không: Nếu một cỗ máy có thể tham gia vào một cuộc hội thoại với con người mà không bị phát hiện nó là cỗ máy, cỗ máy đó đã chứng minh nó có trí thông minh của con người.
Turing Test xuất hiện trong một bài báo xuất bản năm 1950 bởi Alan Turing, một nhà toán học và máy tính tiên phong. Và đã trở thành nền tảng trong lý thuyết và động lực phát triển của Trí tuệ nhân tạo (AI).
BÀI HỌC CHÍNH RÚT RA:
- Turing Test đo lường trí thông minh của một vật thử nghiệm để xác định liệu một cỗ máy có thể thể hiện trí thông minh hay không.
- Theo thử nghiệm, một chương trình máy tính có thể tính toán liệu các phản ứng của nó có thể đánh lừa niềm tin của con người rằng nó cũng là một con người hay không.
- Không phải ai cũng công nhật kết quả của phép thử Turing, nhưng việc vượt qua nó vẫn là một thách thức lớn đối với các nhà phát triển trí tuệ nhân tạo.

Hiểu về Turing Test
Sự phát triển nhanh chóng của máy tính có thể nhìn thấy trong nhiều khía cạnh của cuộc sống. Chúng ta có các chương trình dịch ngôn ngữ chỉ trong nháy mắt, rô bốt dọn dẹp toàn bộ ngôi nhà chỉ trong vài phút và Wearable Technology (công nghệ đeo) theo dõi mức độ sức khỏe và thể chất của người dùng.
Dẫn đầu sự đột phá là sự phát triển của trí tuệ nhân tạo và những giới hạn của máy tính. Vì lý do này, Turing Test được thiết kế ra nhằm đánh giá liệu một máy tính có thể đủ "thông minh" để bị nhầm lẫn là con người hay không. Các nhà phê bình lập luận rằng một máy tính có thể được chế tạo có khả năng suy nghĩ, nhưng không thể có bộ óc của riêng nó. Họ tin rằng sự phức tạp của quá trình suy nghĩ của con người không thể được mã hóa.
Phép thử được tiến hành trong phòng thẩm vấn do một thẩm phán điều hành. Các đối tượng (một người, một chương trình máy) kiểm tra sẽ ẩn danh. Thẩm phán sẽ trò chuyện với cả hai bên và cố gắng xác định đâu là con người và đâu là máy tính. Turing kết luận rằng nếu thẩm phán không thể phân biệt được thì máy tính đã thành công trong việc chứng minh trí thông minh con người của nó. Đó là, nó không thể nghĩ.
Mặc dù Turing Test vẫn gây ra tranh cãi nhưng nhìn chung, nó vẫn được xem là thước đo cho sự thành công của các dự án trí tuệ nhân tạo. Trong phiên bản cập nhật của Turing Test, sẽ có nhiều hơn một thẩm phán thẩm vấn và trò chuyện với hai đối tượng. Nếu hơn 30% thẩm phán, sau năm phút trò chuyện, kết luận rằng máy tính là con người thì dự án được cho là thành công.
Giải thưởng Loebner là một cuộc thi Turing Test được tổ chức hàng năm từ năm 1991-2020 bởi Hugh Loebner, một nhà phát minh người Mỹ. Loebner đã tạo ra các quy tắc bổ sung, yêu cầu con người và chương trình máy tính trò chuyện 25 phút với từng trong số 4 giám. Dự án chiến thắng là chương trình máy tính nhận được nhiều phiếu bầu nhất từ ban giám khảo.
Các phiên bản của Turing Test
Có một số biến thể của các phép Turing, tuy nhiên tất cả đều có mục đích phát hiện đối tượng trả lời là người hay máy móc. Mỗi phiên bản có một cách tiếp cận khác nhau bằng cách hỏi đối tượng các câu hỏi khác nhau và đánh giá các câu trả lời đó.
Trò chơi bắt chước
Phiên bản trò chơi bắt chước của Turing Test thường sử dụng ba bên: Bên thứ nhất là nam, bên thứ hai là nữ, bên thứ ba có nhiệm vụ xác định giới tính của hai người đầu tiên. Bên thứ nhất thường có nhiệm vụ đánh lừa bên thứ ba, trong khi bên thứ hai thường cố gắng giúp bên thứ ba xác định chính xác từng giới tính.
Sau đó, trò chơi bắt chước đã phát triển thành cả hai bên cùng cố gắng lừa bên thứ ba. Trong mọi trường hợp, mục tiêu của phiên bản Turing Test này là xác định xem máy tính có thể bị lừa hay không.
Diễn giải tiêu chuẩn
Phiên bản này của Turing Test sẽ cố gắng xác định liệu máy tính có thể bắt chước con người hay không. Trong diễn giải tiêu chuẩn, đối tượng đầu tiên là máy tính và đối tượng thứ hai là người.
Trong biến thể này, người thứ ba cố gắng khám phá xem đối tượng nào trong số hai người là người và đối tượng nào là máy tính. Người thẩm vấn không phải đối tượng bị kiểm tra mà thay vào đó là máy tính cố gắng đánh lừa con người (trái ngược với hướng trong trò chơi bắt chước).

Những hạn chế của Turing Test
Phép thử Turing yêu cầu một môi trường được kiểm soát chặt chẽ khi tiến hành thực hiện. Những đối tượng tham gia thử nghiệm phải được ẩn danh trong toàn bộ quá trình thử nghiệm, dù vẫn cần có cách liên lạc đáng tin cậy.
Phép thử Turing có thể không phù hợp để kiểm tra trí thông minh vì các hệ thống máy tính có những cấu trúc khác nhau. Do đó, có thể tồn tại những hạn chế về khả năng của máy tính.
Phép thử Turing đang trong quá trình phát triển, tuy nhiên, công nghệ lại cho thấy sự tiến bộ nhanh hơn. Khi máy tính có nhiều khả năng hơn, các phương pháp kiểm tra có thể không còn phù hợp.
Turing Test có thể không phải là thước đo thích hợp cho tất cả các loại trí thông minh. Ví dụ, một máy tính có thể đánh lừa thành công người thẩm vấn dựa trên khả năng xử lý các phản hồi tương tự như con người. Tuy nhiên, điều này có thể không thực sự chỉ ra máy tính đó có trí tuệ, cảm xúc hoặc nhận thức, mà có thể đơn giản chúng có một bộ mã phù hợp và có thẩm quyền cao.
Máy móc có thể bị nhầm lẫn là con người không?
Cho đến nay, chưa có AI nào vượt qua được bài kiểm tra Turing, nhưng một số đã đến khá gần.
Năm 1966, Joseph Weizenbaum (nhà khoa học máy tính và giáo sư MIT) đã tạo ra ELIZA, một chương trình tìm kiếm các từ khóa cụ thể trong các nhận xét đã nhập để chuyển chúng thành câu. Cách thực hiện của nó là giả vờ như một nhà trị liệu tâm lý người Rogeria và đưa ra những phản hồi "không định hướng". Nếu ELIZA không thể tìm thấy từ khóa trong văn bản của người dùng, nó sẽ cung cấp một phản hồi “không định hướng” có chứa từ khóa trước đó trong cuộc trò chuyện. Đó là lý do vì sao ELIZA có thể đánh lừa một số người và tuyên bố là nó một trong những chương trình đã vượt qua bài kiểm tra Turing. Tuy nhiên, ELIZA là một mục tiêu khá dễ dàng để bị đánh trượt.

Năm 1972, PARRY, một chatbot mô hình hóa hành vi của một người tâm thần phân liệt đã sử dụng cách tiếp cận tương tự ELIZA. Trong Turing Test, hai nhóm bác sĩ tâm thần đã phân tích bản ghi cuộc trò chuyện của cả bệnh nhân thực tế và máy tính chạy PARRY. Các bác sĩ tâm thần đã bị lừa 48% thời gian - thật ấn tượng!
Tua nhanh đến năm 2014, trong một cuộc thi nhằm tưởng niệm 60 năm ngày mất của Alan Turing, Eugene Goostman, đã gây xôn xao khi tuyên bố vượt qua Turing Test. Eugene Goostman là một chương trình máy tính mô phỏng một cậu bé 13 tuổi đến từ Ukraine. Nó đã thuyết phục 33% người đánh giá rằng nó là con người. Tuy nhiên, lượng giám khảo chỉ có ba người, tức là nó chỉ đánh lừa được một người, đây không phải là một kết quả thực sự chính xác.
Vào năm 2018, Google Duplex đã được giới thiệu tại Hội nghị nhà phát triển Google I/O hàng năm và đã thể hiện khả năng thực hiện các tác vụ qua điện thoại. Để chứng minh, Duplex đã lên lịch hẹn làm tóc và gọi điện đến nhà hàng, những người ở đầu dây bên kia không hề nhận ra họ đang nói chuyện với một chiếc máy. Một số người tin rằng Google Duplex đã vượt qua Turing Test. Tuy nhiên số khác cho rằng Google Duplex còn lâu mới vượt qua được bài kiểm tra Turing.
Duplex là một hệ thống học sâu đại diện cho 'Làn sóng thứ hai của AI' - được đào tạo với hàng trăm giờ để thực hiện các nhiệm vụ rất hẹp. Học theo thời gian thực, hiểu sâu, suy luận đòi hỏi khả năng nhận thức thực sự mà không chương trình AI của Làn sóng thứ hai nào có được. Thế nhưng ngay khi con người dẫn dắt cuộc trò chuyện theo một hướng khác, Google Duplex sẽ thất bại.

Khi nào AI có thể vượt qua Turing Test?
Một số ý kiến cho rằng nó có thể xảy ra vào năm 2030, một số nói sẽ không sớm hơn năm 2040. Hầu hết các nhà khoa học AI đều đồng ý rằng chúng ta cần biết thêm về bộ não con người trước khi tạo ra thứ gì đó mà chúng ta vẫn chưa hiểu rõ.
Theo nhà khoa học thần kinh, nhà sản xuất trò chơi máy tính và bậc thầy cờ vua Demis Hassabis, để thực sự tiến bộ trong lĩnh vực AI, chúng ta cần hiểu cách bộ não con người hoạt động ở cấp độ thuật toán.
Con người có thể thất bại trong Turing Test không?
Câu trả lời là có. Mặc dù Turing Test dựa trên kiến thức và trí thông minh, nhưng nó cũng nhằm đánh giá cách thức các câu trả lời được đưa ra. Bạn có thể đưa câu trả lời chính xác hay không chỉ là một phần trong đó, phép thử Turing đánh giá bạn mất bao lâu để đưa ra câu trả lời đó. Bất kỳ phản ứng nhầm lẫn nào của con người, cũng có thể bị nhầm với máy tính.
Ví dụ về câu hỏi trong Turing Test
Một ví dụ thú vị về câu hỏi trong phép thử Turing là có thể dựa trên ngôn ngữ và cách chơi chữ. Chẳng hạn, một câu hỏi "sự khác biệt giữa ‘flight time’ và ‘plane in flight’?". Mặc dù loại câu hỏi này có thể không công bằng đối với người tham gia không quen thuộc, nhưng đây cũng là một ví dụ về khả năng phân biệt logic trong đó một trường hợp đơn lẻ (tức là từ ‘flight’) có thể được hiểu theo nhiều nghĩa khác nhau trong những ngữ cảnh khác nhau.
Các câu hỏi trong Turing Test thường vô nghĩa. Những câu hỏi như "Is the difference between football that the batter wears a helmet?" là câu sai ngữ pháp và con người dễ dàng phát hiện ra. Tuy nhiên, một máy tính vẫn có thể cố gắng phân tích cú pháp đó để phản hồi.
Kết luận
Turing Test là một bài đánh giá để xác định một cỗ máy có thể thể hiện trí thông minh giống con người hay không. Ngày nay, có nhiều biến thể của phép thử Turing và khi công nghệ tiếp tục phát triển, các giải pháp mới để xác định trí thông minh sẽ cần phải nâng cấp.