Thử nghiệm Turing là gì và nó có bao giờ bị đánh bại không?

Liệu trí tuệ nhân tạo có thể phù hợp với trí thông minh của con người? Đó là một câu hỏi khó liên quan đến triết học, tâm lý học, khoa học máy tính và mọi chủ đề. Bất cứ khi nào nói về trí thông minh máy móc ở cấp độ con người, Thử nghiệm Turing không bao giờ là quá xa.

Vào năm 2014, các nhà báo Internet đã bùng nổ trong sự phấn khích điên cuồng khi một chương trình máy tính có trụ sở tại London tên là Eugene Goostman dường như đã vượt qua Bài kiểm tra Turing. Vào năm 2022, LaMDA của Google được cho là cũng làm như vậy, nhưng chuyện gì đã xảy ra? Họ đã vượt qua bài kiểm tra? Những tiến bộ về trí tuệ nhân tạo có ý nghĩa gì đối với Thử nghiệm Turing?

Mục Lục

Thử nghiệm Turing là gì?

Ban đầu được gọi là “Trò chơi bắt chước”, Thử nghiệm Turing được phát triển bởi Alan Turing. Bất chấp cái tên của nó, Phép thử Turing không phải là một phép thử thực sự—ít nhất, không phải theo nghĩa thông thường của từ này. Đó là nhiều hơn một thử nghiệm suy nghĩ. Tuy nhiên, Alan Turing là một nhà toán học có ảnh hưởng lớn, người đã chính thức hóa nhiều khái niệm dẫn đến sự ra đời của khoa học máy tính.

Thử nghiệm Turing là một bộ hướng dẫn nhằm xác định xem máy có thể phân biệt được với con người hay không. Nó cố gắng trả lời câu hỏi “Máy móc có thể suy nghĩ không?” Turing tin rằng điều đó là có thể và đã thiết kế một thứ giống như một loại trò chơi.

Đây là cách giải thích tiêu chuẩn của Thử nghiệm Turing:

Bạn đang thẩm vấn hai người
Người A là một cỗ máy, trong khi Người B là một con người.
Bạn chỉ có thể giao tiếp với họ bằng văn bản.
Bằng cách đặt câu hỏi, xác định cái nào là máy và cái nào là con người.

Độ dài trò chơi tiêu chuẩn cho bài kiểm tra có thể từ vài phút đến vài giờ. Chất lượng và nội dung của cuộc trò chuyện là những yếu tố quan trọng trong thời lượng. Một bài kiểm tra thời lượng cố định cũng có thể được thực hiện; thời lượng tiêu chuẩn thường là năm phút.

Các tiêu chí thông thường để vượt qua bài kiểm tra là chủ quan, nhưng theo cách hiểu chung, máy móc phải đánh lừa được ít nhất 30% tổng số người thẩm vấn là con người. Turing dự đoán rằng bất kỳ cỗ máy nào làm được điều đó đều có thể đủ “thông minh” để được gọi là “cỗ máy biết suy nghĩ”.

Hạn chế của bài kiểm tra Turing

Mặc dù Thử nghiệm Turing nhằm mục đích tìm hiểu xem máy móc có thể suy nghĩ hay không, nhưng có một số nhược điểm.

Hạn chế chính của Thử nghiệm Turing là việc một cỗ máy không thể phân biệt được với con người không nhất thiết chỉ ra trí thông minh. Nói cách khác, Thử nghiệm Turing chứng minh khả năng tự suy nghĩ của máy móc hay khả năng bắt chước hành vi của con người? Đó là một sự khác biệt tinh tế với ý nghĩa rất lớn. Rốt cuộc, một chatbot với đủ dòng mã có thể bắt chước cuộc trò chuyện của con người mà không cần phải thực sự thông minh. Điều này đưa ra một câu hỏi tiếp theo. Là hành vi bên ngoài đủ để chỉ ra những suy nghĩ bên trong?

Một nhược điểm lớn khác cần lưu ý là thiếu nhóm kiểm soát. Theo định nghĩa, kết quả Thử nghiệm Turing dựa trên một nhóm người thẩm vấn, nhưng không phải tất cả mọi người đều bình đẳng. Mặc dù Turing xác định rằng các tiêu chí chỉ liên quan đến “những người thẩm vấn trung bình.” Thuật ngữ “trung bình” theo định nghĩa là không cụ thể và do đó, những người thẩm vấn khác nhau sẽ mang lại những kết quả khác nhau và không nhất quán.

Hơn nữa, bản chất tùy ý của các tiêu chí thử nghiệm là một vấn đề. Tại sao lại có giới hạn năm phút và tại sao tỷ lệ đánh lừa của những người thẩm vấn được đặt ở mức 30%? Tại sao không phải mười phút và 50%? Sự thật là những con số đó bắt nguồn từ dự đoán của Turing về tình trạng trí tuệ nhân tạo trong tương lai. Anh ấy không bao giờ có ý định coi chúng là những ngưỡng rõ ràng. Tuy nhiên, hiện tại, những con số đó đã đủ tốt để trở thành mục tiêu cần đạt được.

Eugene Goostman hoặc LaMBDA có vượt qua bài kiểm tra Turing không?

Trong mười năm qua, đã có hai tuyên bố chính rằng Phép thử Turing đã được thông qua.

Eugene Goostman

Vào tháng 6 năm 2014, một chatbot có tên là Eugene Goostman lần đầu tiên tuyên bố đã vượt qua Bài kiểm tra Turing. Được phát triển bởi một nhóm các lập trình viên người Ukraine, chatbot đóng vai một cậu bé người Ukraine 13 tuổi và đã thuyết phục được 33% trong một hội đồng bao gồm 30 người tham gia trong một loạt các cuộc trò chuyện kéo dài 5 phút.

Kể từ năm 2014, đã có nhiều suy đoán và tranh cãi xung quanh tuyên bố này. Một trong những lời chỉ trích chính đối với Eugene Goostman là việc hạ thấp tiêu chí Thử nghiệm Turing một cách lừa dối. Các nhà phát triển tuyên bố chiếc máy tính này là của một cậu bé 13 tuổi không nói được tiếng Anh bản ngữ và sống cách xa xã hội hiện đại nên không biết gì về các chủ đề như địa lý, văn hóa đại chúng, v.v.

Bằng cách đóng khung Eugene Goostman trong bối cảnh này, những người thẩm vấn không cần phải giữ câu trả lời của máy theo tiêu chuẩn thông thường. Rốt cuộc, nhiều chatbot hiện đại có thể tổ chức các cuộc trò chuyện tương tự. Sự khác biệt với Eugene Goostman là bối cảnh tường thuật xung quanh cỗ máy cho phép những khúc mắc trong cuộc trò chuyện trở nên đáng tin cậy hơn.

LaMBDA của Google

Vì vậy, Eugene Goostman có thể không vượt qua bài kiểm tra Turing, nhưng còn LaMDA của Google thì sao?

Vào năm 2022, một kỹ sư của Google tên là Blake Lemoine đã tuyên bố một trong những mô hình ngôn ngữ trí tuệ nhân tạo của công ty, được gọi là LaMDA (Mô hình ngôn ngữ cho các ứng dụng đối thoại), đã vượt qua thành công Bài kiểm tra Turing. Lemoine cũng tuyên bố rằng LaMDA có tri giác. Sau đó, anh ta công khai thông tin, chia sẻ các tương tác dựa trên văn bản giữa anh ta và mô hình ngôn ngữ AI, sau đó anh ta được nghỉ phép có lương và cuối cùng bị sa thải, theo The Guardian.

Lemoine tập trung đặc biệt vào một trường hợp mà anh ấy hỏi: “Từ ‘linh hồn’ có nghĩa là gì đối với bạn?” LaMDA của Google đã trả lời: “Đối với tôi, linh hồn là một khái niệm về lực hoạt hình đằng sau ý thức và bản thân sự sống.”

Lemoine tuyên bố rằng đây là LaMDA lo sợ về cái chết của nó. Thật không may, điều này đã nhanh chóng được chứng minh là sai và LaMDA đã không vượt qua Bài kiểm tra Turing. Các nhà phê bình chỉ ra rằng trong trường hợp này, LaMDA đã đánh lừa được một người tham gia và người tham gia biết rằng họ đang nói chuyện với một chiếc máy. Ý thức về cái chết của chính LaMDA chỉ đơn giản là kết quả của mã được thiết kế để hoạt động tương tự như tự động sửa lỗi.

Sự tiến bộ của trí tuệ máy tính

Trong những năm gần đây, trí tuệ nhân tạo đã có những bước tiến lớn. Sự chú ý của công chúng đã tập trung vào ChatGPT kể từ khi ra mắt chính thức vào tháng 11 năm 2022. Hơn nữa, Google đã giới thiệu AI tổng quát của mình, Bard. Điều này hiện có sẵn cho người dùng ở Vương quốc Anh và Hoa Kỳ.

Trí thông minh máy tính tập trung vào các công nghệ học sâu, xử lý ngôn ngữ tự nhiên, học tăng cường, mạng đối thủ tổng quát và điện toán biên với tích hợp IoT. Tất cả đều đã có những tiến bộ đáng kể trong năm năm qua. Những lĩnh vực này tiếp tục phát triển với tốc độ đáng kinh ngạc nhờ trí thông minh máy tính được sử dụng để cải thiện chính nó.

Trí tuệ nhân tạo hiện đang được sử dụng bởi công chúng trên toàn cầu. Hàng triệu truy vấn đang diễn ra hàng ngày, vì vậy AI chắc chắn tiếp xúc với một lượng dữ liệu khổng lồ. Điều này chắc chắn sẽ cho phép các mô hình AI bắt chước ngôn ngữ và hành vi của con người. Tuy nhiên, trí thông minh hoặc tri giác có thể đòi hỏi những tiến bộ đáng kể hơn nữa đối với các công nghệ cốt lõi của mô hình AI. Có một số người tự hỏi liệu sự phát triển của AI có gây ra bất kỳ rủi ro nào không.

Trò chuyệnGPT

ChatGPT tiếp tục phát triển với nhiều mục đích sử dụng khác nhau. Có rất nhiều tin đồn xung quanh mô hình AI này vào năm 2023 và thật dễ hiểu tại sao. Tuy nhiên, mặc dù có suy đoán nhưng không có nghiên cứu chính thức nào được công bố về việc liệu ChatGPT có thể vượt qua Bài kiểm tra Turing hay không.

Nhiều chuyên gia đầu ngành tuyên bố rằng chúng ta có thể thấy Thử nghiệm Turing bị ChatGPT-5 đánh bại, nhưng vẫn chưa có khung thời gian cho việc phát hành phiên bản ChatGPT tiếp theo.

Bài kiểm tra Turing chưa được thông qua chắc chắn

Trí tuệ nhân tạo tiếp tục phát triển, và mặc dù đã có một số tuyên bố, nhưng vẫn chưa có sự đồng ý dứt khoát nào trong ngành rằng Thử nghiệm Turing đã bị đánh bại. Điều này phần lớn là do bản chất chủ quan của những gì cấu thành “trí thông minh” và những hạn chế của các tham số Thử nghiệm Turing.

Nhiều người tin rằng Bài kiểm tra Turing chỉ khuyến khích sự bắt chước của con người hơn là trí thông minh tư duy thực sự. Trên thực tế, các bài kiểm tra AI khác đã được thiết kế trong những năm gần đây phức tạp và cụ thể hơn. Có lẽ khi trí tuệ nhân tạo bắt chước con người tốt hơn, cách thực sự duy nhất để đo lường trí thông minh của máy móc là sử dụng một bài kiểm tra khác.

Thử nghiệm Turing có thể mang tính biểu tượng, nhưng có lẽ đã đến lúc chúng ta gác lại và tiếp tục.

Thử nghiệm Turing là gì và nó có bao giờ bị đánh bại không?