Các mô hình AI hiện đại như ChatGPT có thể viết mã, giải toán và vượt qua nhiều kỳ thi phức tạp. Tuy nhiên, một nghiên cứu mới lại cho thấy những hệ thống này gặp khó khăn trước một bài kiểm tra tâm lý học đã tồn tại gần một thế kỷ. Kết quả này đang làm dấy lên những cuộc tranh luận mới về việc liệu trí tuệ nhân tạo có thực sự tiến gần tới AGI – trí tuệ nhân tạo tổng quát – hay không.
Hiệu ứng Stroop là gì?
Để hiểu nghiên cứu mới, trước tiên cần biết về hiệu ứng Stroop (Stroop Effect), một trong những thí nghiệm nổi tiếng nhất trong lĩnh vực tâm lý học nhận thức.
Bài kiểm tra đánh giá khả năng kiểm soát nhận thức
Trong bài kiểm tra Stroop, người tham gia sẽ nhìn thấy tên của một màu sắc được viết bằng một màu khác.
Ví dụ, từ “Đỏ” có thể được hiển thị bằng màu xanh lá cây. Nhiệm vụ của người tham gia không phải là đọc từ đó, mà phải xác định màu sắc thực tế đang được hiển thị.
Con người thường mất nhiều thời gian hơn để trả lời khi chữ và màu sắc mâu thuẫn với nhau, bởi não bộ phải ức chế phản xạ đọc từ ngữ để tập trung vào màu sắc hiển thị.
Vì sao bài kiểm tra này quan trọng?
Hiệu ứng Stroop từ lâu được sử dụng để đánh giá khả năng chú ý, kiểm soát nhận thức và xử lý thông tin xung đột.
Đây là những kỹ năng cốt lõi liên quan đến tư duy linh hoạt – một đặc điểm được xem là nền tảng của trí thông minh ở con người.
ChatGPT và nhiều mô hình AI gặp khó khăn bất ngờ
Theo nghiên cứu từ một số chuyên gia, nhiều mô hình AI tiên tiến hiện nay, bao gồm ChatGPT và các hệ thống ngôn ngữ lớn khác, đã thể hiện kết quả không như kỳ vọng khi thực hiện các biến thể của bài kiểm tra Stroop.

AI xử lý ngôn ngữ quá mạnh
Các nhà nghiên cứu nhận thấy mô hình AI thường bị ảnh hưởng mạnh bởi từ ngữ xuất hiện trong câu hỏi.
Điều này khiến chúng có xu hướng ưu tiên nội dung văn bản thay vì thực hiện chính xác yêu cầu nhận diện màu sắc hoặc xử lý thông tin mâu thuẫn.
Nói cách khác, AI có thể rất giỏi dự đoán từ tiếp theo trong một chuỗi văn bản, nhưng lại gặp khó khăn khi phải xử lý các tín hiệu cạnh tranh giống như cách bộ não con người thực hiện.
Khả năng suy luận chưa thực sự giống con người
Nghiên cứu cho thấy dù các mô hình ngôn ngữ lớn có thể đạt điểm rất cao trong nhiều bài kiểm tra học thuật, chúng vẫn chưa sở hữu cơ chế nhận thức tương tự con người.
Điều này phản ánh sự khác biệt giữa việc dự đoán ngôn ngữ dựa trên dữ liệu huấn luyện và khả năng hiểu thế giới một cách linh hoạt.
Các chuyên gia cho rằng đây là một trong những lý do khiến AI vẫn mắc phải những lỗi tưởng chừng rất đơn giản đối với con người.
Thách thức đối với mục tiêu AGI
AGI là gì?
AGI (Artificial General Intelligence) hay trí tuệ nhân tạo tổng quát là khái niệm mô tả một hệ thống AI có khả năng học hỏi, suy luận và giải quyết vấn đề trên nhiều lĩnh vực khác nhau tương đương hoặc vượt con người.
Khác với AI hiện nay vốn được tối ưu cho các nhiệm vụ cụ thể, AGI được kỳ vọng có thể thích nghi với những tình huống hoàn toàn mới mà không cần huấn luyện lại từ đầu.
Bài kiểm tra Stroop cho thấy khoảng cách vẫn còn lớn
Kết quả nghiên cứu đã làm nổi bật một thực tế rằng khả năng xử lý ngôn ngữ xuất sắc không đồng nghĩa với việc AI đã đạt được trí thông minh tổng quát.
Một số nhà khoa học nhận định rằng các mô hình hiện tại vẫn chủ yếu dựa vào nhận diện mẫu trong dữ liệu khổng lồ thay vì hiểu biết thực sự về thế giới.
Nếu AI chưa thể xử lý hiệu quả các bài kiểm tra nhận thức cơ bản liên quan đến sự xung đột thông tin, con đường tiến tới AGI có thể còn dài hơn nhiều so với những dự đoán lạc quan gần đây.
Không phải dấu chấm hết cho AI
Dù vậy, các chuyên gia cũng cảnh báo rằng không nên đánh giá toàn bộ năng lực của AI chỉ thông qua một dạng bài kiểm tra.
AI vẫn tiến bộ rất nhanh
Trong vài năm qua, các mô hình như ChatGPT đã đạt được những bước tiến vượt bậc trong lĩnh vực lập trình, sáng tạo nội dung, nghiên cứu khoa học và hỗ trợ công việc.
Những thành tựu này cho thấy AI vẫn đang phát triển với tốc độ chưa từng có.
Các mô hình tương lai có thể khắc phục hạn chế
Nhiều nhà nghiên cứu tin rằng các kiến trúc AI thế hệ tiếp theo sẽ tích hợp thêm khả năng suy luận, bộ nhớ dài hạn và cơ chế nhận thức tiên tiến hơn.
Điều này có thể giúp AI xử lý tốt hơn các nhiệm vụ liên quan đến sự chú ý, kiểm soát nhận thức và tư duy linh hoạt – những điểm yếu mà bài kiểm tra Stroop đang làm lộ rõ.
Kết luận
Nghiên cứu mới về hiệu ứng Stroop cho thấy ChatGPT và nhiều mô hình AI hiện đại vẫn tồn tại những hạn chế đáng kể trong các bài kiểm tra nhận thức mang tính nền tảng. Dù AI đã đạt được nhiều thành tựu ấn tượng trong xử lý ngôn ngữ và suy luận, kết quả này nhắc nhở rằng AGI vẫn là một mục tiêu đầy thách thức.
Trong tương lai, sự phát triển của các mô hình AI có thể thu hẹp khoảng cách này, nhưng hiện tại, trí tuệ nhân tạo vẫn còn nhiều điều phải học trước khi đạt đến mức độ linh hoạt và thích nghi như bộ não con người.

