ChatGPT ngày càng “xuống cấp”, điều gì đã xảy ra với “con cưng” của OpenAI?
BÀI LIÊN QUAN
Threads gây “sốc” khi đạt 100 triệu người dùng chỉ sau 5 ngày, phá vỡ kỷ lục của cả ChatGPT và TikTokSức nóng của ChatGPT bắt đầu hạ nhiệt, nguy cơ bong bóng AI nổ tung?ChatGPT không phải lúc nào cũng đúngTheo Phụ nữ thủ đô, chatbot AI ChatGPT ở thời điểm mới ra mắt vào tháng 11/2022 đã có thể trả lời mọi câu hỏi một cách nhanh chóng và đó là lý do mà chatbot này đã tạo nên cơn sốt trên mạng và sớm trở thành ứng dụng web phát triển nhanh nhất trong lịch sử internet, thu hút hàng trăm triệu người dùng hoạt động mỗi tháng, được ghi nhận vào tháng 1/2023.
Vì sự đa năng của ChatGPT mà chatbot này đã thu hút nhiều cư dân mạng đổ xô tìm tới website để dùng thử chatbot này và yêu cầu nó tạo ra những loại văn bản như bài luận, email hay thậm chí là lập trình. Thế nhưng, dường như mọi chuyện đã thay đổi vào thời điểm tháng 6/2023, nghĩa là sau 7 tháng từ khi ChatGPT ra mắt. Cụ thể, chatbot này đã nhận “cơn mưa” phàn nàn từ người dùng. Một trong số đó là sự thất vọng về việc mô hình AI mới nhất sau ChatGPT là phiên bản GPT-4 đang dần trở nên kém thông minh hơn.
Thực tế cho thấy một báo cáo vừa được thực hiện mới đây của các nhà nghiên cứu đến từ 2 trường đại học nổi tiếng là UC Berkeley và Stanford cũng đã đưa ra kết luận tương tự như vậy.
Đây là hiện tượng thực sự khó hiểu bởi lẽ các mô hình AI tạo sinh dùng đầu vào là dữ liệu của người dùng để liên tục tự đào tạo. Điều đó sẽ khiến chúng trở nên thông minh hơn khi tích lũy được nhiều mục nhập theo thời gian của người dùng hơn. Điều bất ngờ là ChatGPT lại không thực hiện được điều đó.
Thế nhưng, một số nhà nghiên cứu AI cho biết lý giải cho sự xuống cấp của ChatGPT có thể nằm ở một khái niệm mang tên “drift"(hay Độ lệch).
“Độ lệch” nhắc đến việc các mô hình ngôn ngữ lớn LLM hoạt động theo cách không thể đoán trước hoặc không mong muốn, chệch hướng khỏi các tham số ban đầu. Và điều đó có thể xảy ra vì nỗ lực cải thiện các bộ phận của mô hình trí tuệ nhân tạo phức tạp khiến các bộ phận khác hoạt động kém hiệu quả hơn.
ChatGPT đang “chệch” một cách đáng báo động
Báo cáo của các nhà nghiên cứu từ Đại học California tại Berkeley và Đại học Stanford đã chỉ ra độ lệch và kiểm tra các mà các mô hình ngôn ngữ lớn phổ biến của ChatGPT, trong đó có GPT 3.5 (LLM đằng sau ChatGPT) và GPT-4 (LLM đằng sau Bing Chat và ChatGPT Plus ) thay đổi theo thời gian.
Nghiên cứu đã đưa ra so sánh về khả năng của cả hai LLm trong các bài đánh giá, trong đó có việc giải toán, trả lời những câu hỏi nhạy cảm và trả lời khảo sát ý kiến cũng như trả lời những câu hỏi chuyên sâu về kiến thức đa chặng, lập trình và bài kiểm tra về Giấy phép Y khoa tại Mỹ. Cùng với đó là hoàn thành những nhiệm vụ lý luận mang tính trực quan. Bài kiểm tra này được triển khai thực hiện vào tháng 3 và tháng 6.
Theo kết quả nghiên cứu ở trên, so với phiên bản tháng 6, thì phiên bản tháng 3 của GPT-4 vượt trội hơn ở nhiều trường hợp, đáng chú ý nhất là các lời nhắc về toán học cơ bản. Mặt khác, phiên bản tháng 3 này lại vượt trội hơn bản tháng 6 trong cả 2 ví dụ a và b. Trong việc lập trình, hay trả lời các câu hỏi kiểm tra y tế và trả lời các cuộc khảo sát ý kiến, GPT-4 cũng kém hơn. Tất cả những điều đó có thể quy cho hiện tượng về driff.
Liên quan tới hiện tượng này, James Zou, một trong những nhà nghiên cứu khẳng định rất bất ngờ về tốc độ lệch đang xảy ra quá nhanh đối với ChatGPT.
Trên diễn đàn dành cho nhà phát triển của OpenAI trước đó, một cuộc tranh luận về tình trạng đi xuống của ChatGPT về chất lượng phản hồi cũng đã xảy ra. Theo nhiều người dùng trong cộng đồng AI, đó có thể được xem là một thách thức với Open AI khi GPT-4 đa phần được cung cấp cho những người dùng trả phí truy cập.
Theo một số ý kiến khác, nếu đó là mô hình ngôn ngữ lớn tiên tiến nhất của OpenAi thì cần có màn thể hiện tốt hơn để tạo nên lợi thế trong cuộc cạnh tranh gay gắt với các đối thủ trên thị trường. Đáng chú ý, cộng đồng AI đang nhận định rằng việc thiết kế lại triệt để mô hình là lý do khiến chất lượng của GPT-4 ngày càng giảm. Thế nhưng, Open AI đã phản bác lại với ý kiến đó.
Theo Peter Welinder, Phó chủ tịch sản phẩm tại OpenAI, họ không tạo nên một GPT-4 ngu ngốc hơn mà hoàn toàn ngược lại. Ông cho biết công ty làm cho mỗi phiên bản mới trở nên thông minh hơn so với phiên bản trước. Thế nhưng, tuyên bố đó được đưa ra trước khi các nhà nghiên cứu tại Đại học Stanford công bố báo cáo.
Mặt khác, dữ liệu từ công ty phân tích SimilarWeb cho biết ước tính lưu lượng truy cập toàn cầu vào trang web ChatGPT của OpenAI giảm khoảng 10% trong giai đoạn từ tháng 5 đến tháng 6. Đó là con số ghi nhận số lượng truy cập vào mô hình ngôn ngữ lớn này sụt giảm lần đầu tiên kể từ khi ChatGPT được giới thiệu vào tháng 11/2022.
Vào tháng 6/2023, lưu lượng truy cập trên toàn cầu từ PC và thiết bị di động đến trang web của ChatGPT đã sụt giảm 9,7% vào tháng 6/2023 so với tháng trước. Lưu lượng truy cập tại Mỹ sụt giảm 10,3%. Số lượng người dùng truy cập trên toàn cầu cũng giảm 5,7%. Bên cạnh đó, người dùng cũng dành ít thời gian hơn để tương tác với ChatGPT và mức độ tương tác trong tháng 5 sụt giảm 8,5% so với tháng 4.
Similarweb cho biết ChatGPT không còn duy trì được sức nóng của mình trong việc có thể trở thành trang web có nhiều lượt truy cập nhất trên toàn cầu. Hay nói một cách khác, trang web trình diễn công nghệ của Open AI khó có thể làm lu mờ Google, bởi ông lớn này vốn đã trở thành một hiện tượng từ lâu.