Giải thích về 5 tính năng mới tốt nhất của GPT-4
OpenAI cuối cùng đã ra mắt bản cập nhật GPT rất được mong đợi, GPT-4. Mô hình ngôn ngữ lớn (LLM) đi kèm với một số tính năng và khả năng mới mạnh mẽ đã gây sốc cho người dùng trên toàn thế giới.
Ngoài việc tốt hơn đáng kể so với GPT-3.5, LLM hiện có hỗ trợ chatbot ChatGPT lan truyền của OpenAI, GPT-4 có thể hiểu các đầu vào phức tạp hơn, có giới hạn đầu vào ký tự lớn hơn nhiều, có khả năng đa phương thức và được cho là an toàn hơn khi sử dụng.
Mục Lục
1. GPT-4 có thể hiểu các đầu vào phức tạp hơn
Một trong những tính năng mới lớn nhất của GPT-4 là khả năng hiểu các lời nhắc phức tạp và nhiều sắc thái hơn. Theo OpenAI, GPT-4 “thể hiện hiệu suất ở cấp độ con người trên các tiêu chuẩn chuyên môn và học thuật khác nhau.”
Điều này đã được chứng minh bằng cách đưa GPT-4 vượt qua một số bài kiểm tra cấp độ con người và bài kiểm tra tiêu chuẩn hóa, chẳng hạn như SAT, BAR và GRE mà không cần đào tạo cụ thể. GTP-4 không chỉ hiểu và giải quyết các bài kiểm tra này với số điểm tương đối cao trên bảng, mà còn đánh bại người tiền nhiệm của nó, GPT-3.5, mỗi lần.
Khả năng hiểu các lời nhắc nhập nhiều sắc thái hơn cũng được hỗ trợ bởi thực tế là GPT-4 có giới hạn từ lớn hơn nhiều. Mô hình mới có thể xử lý lời nhắc đầu vào lên tới 25.000 từ (đối với ngữ cảnh, GPT-3.5 bị giới hạn ở 8.000 từ). Điều này sẽ ảnh hưởng trực tiếp đến chi tiết mà người dùng có thể đưa vào lời nhắc của họ, do đó cung cấp cho mô hình nhiều thông tin hơn để làm việc và tạo ra kết quả đầu ra dài hơn.
GPT-4 cũng hỗ trợ hơn 26 ngôn ngữ, bao gồm các ngôn ngữ sử dụng ít tài nguyên như tiếng Latvia, tiếng Wales và tiếng Swahili. Khi được đo điểm chuẩn về độ chính xác ba lần bắn trên điểm chuẩn MMLU, GPT-4 đánh bại GPT-3.5 cũng như các LLM hàng đầu khác như PaLM và Chinchilla về hiệu suất tiếng Anh trong 24 ngôn ngữ.
2. Khả năng đa phương thức
Phiên bản trước của ChatGPT chỉ giới hạn ở các lời nhắc bằng văn bản. Ngược lại, một trong những tính năng mới nhất của GPT-4 là khả năng đa phương thức của nó. Mô hình có thể chấp nhận cả lời nhắc bằng văn bản và hình ảnh.
Điều này có nghĩa là AI có thể chấp nhận hình ảnh làm đầu vào và diễn giải cũng như hiểu nó giống như lời nhắc văn bản. Khả năng này mở rộng tất cả các kích cỡ và loại hình ảnh và văn bản, bao gồm các tài liệu kết hợp cả hai, bản phác thảo vẽ tay và thậm chí cả ảnh chụp màn hình.
Tuy nhiên, khả năng đọc hình ảnh của GPT-4 không chỉ đơn giản là diễn giải chúng. OpenAI đã giới thiệu điều này trong luồng dành cho nhà phát triển của mình (ở trên), nơi họ cung cấp cho GPT-4 một bản mô phỏng vẽ tay của một trang web trò đùa. Người mẫu được giao nhiệm vụ viết mã HTML và JavaScript để biến mô hình mô phỏng thành một trang web đồng thời thay thế những câu chuyện cười bằng những câu chuyện thực tế.
GPT-4 đã viết mã trong khi sử dụng bố cục được chỉ định trong mô hình. Sau khi thử nghiệm, đoạn mã này đã tạo ra một trang web hoạt động với, như bạn có thể đoán, là những trò đùa thực tế. Điều đó có nghĩa là những tiến bộ của AI sẽ có nghĩa là sự kết thúc của lập trình? Không hoàn toàn, nhưng nó vẫn là một tính năng hữu ích trong việc hỗ trợ các lập trình viên.
Mặc dù tính năng này có vẻ hứa hẹn nhưng nó vẫn đang trong giai đoạn xem trước nghiên cứu và chưa có sẵn công khai. Ngoài ra, mô hình mất rất nhiều thời gian để xử lý các đầu vào trực quan, với chính OpenAI tuyên bố rằng nó có thể mất nhiều công sức và thời gian để nhanh hơn.
3. Khả năng điều khiển tốt hơn
OpenAI cũng tuyên bố rằng GPT-4 có khả năng điều khiển cao. Nó cũng khiến AI khó phá vỡ nhân vật hơn, nghĩa là nó ít có khả năng bị lỗi hơn khi được triển khai trong một ứng dụng để chơi một nhân vật nhất định.
Các nhà phát triển có thể quy định phong cách và nhiệm vụ AI của họ bằng cách mô tả hướng trong thông báo “hệ thống”. Những thông báo này cho phép người dùng API tùy chỉnh nhiều trải nghiệm người dùng trong một số giới hạn nhất định. Vì những thông báo này cũng là cách dễ dàng nhất để “bẻ khóa” mô hình, nên họ cũng đang nỗ lực để làm cho chúng an toàn hơn. Bản demo cho GPT-4 đã đóng đinh điểm này bằng cách yêu cầu người dùng cố gắng ngăn GPT-4 trở thành gia sư Socrates và trả lời câu hỏi của họ. Tuy nhiên, người mẫu từ chối phá vỡ nhân vật.
4. An toàn
OpenAI đã dành sáu tháng để làm cho GPT-4 an toàn hơn và phù hợp hơn. Công ty tuyên bố rằng khả năng phản hồi các yêu cầu về nội dung không phù hợp hoặc không được phép thấp hơn 82%, khả năng phản hồi theo chính sách của OpenAI đối với các yêu cầu nhạy cảm cao hơn 29% và khả năng đưa ra phản hồi thực tế cao hơn 40% so với GPT-3.5 .
Nó không hoàn hảo và thỉnh thoảng bạn vẫn có thể mong đợi nó “ảo giác” và có thể sai trong các dự đoán của nó. Chắc chắn, GPT-4 có khả năng nhận thức và dự đoán tốt hơn, nhưng bạn vẫn không nên tin tưởng một cách mù quáng vào AI.
5. Cải thiện hiệu suất
Ngoài việc đánh giá hiệu suất của mô hình trong các bài kiểm tra của con người, OpenAI còn đánh giá bot trên các điểm chuẩn truyền thống được thiết kế cho các mô hình máy học.
Nó tuyên bố rằng GPT-4 “vượt trội đáng kể” các LLM hiện có và “hầu hết các mẫu hiện đại nhất”. Các điểm chuẩn này bao gồm MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval và Drop đã nói ở trên, tất cả đều kiểm tra khả năng của từng cá nhân.
Bạn sẽ tìm thấy kết quả tương tự khi so sánh hiệu suất trên tiêu chuẩn tầm nhìn học thuật. Các thử nghiệm đã chạy bao gồm VQAv2, TextVQA, ChartQA, Sơ đồ AI2 (AI2D), DocVQA, Infographic VQA, TVQA và LSMDC, tất cả đều đứng đầu GPT-4. Tuy nhiên, OpenAI đã tuyên bố rằng kết quả của GPT-4 trong các thử nghiệm này “không thể hiện đầy đủ mức độ khả năng của nó” vì các nhà nghiên cứu tiếp tục tìm ra những điều mới và thách thức hơn mà mô hình có thể giải quyết.
Bước nhỏ cho GPT-4, Bước nhảy vọt cho AI
Với độ chính xác cao hơn, an toàn hơn khi sử dụng và các khả năng nâng cao, GPT-4 đã được phát hành ra công chúng thông qua gói thuê bao hàng tháng ChatGPT+ có giá 20 đô la mỗi tháng. Ngoài ra, OpenAI đã hợp tác với các tổ chức khác nhau để bắt đầu xây dựng các sản phẩm hướng tới người tiêu dùng với GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes và Khan Academy, trong số những người khác, đã triển khai GPT-4 trong các sản phẩm của họ.
GPT-4 có thể là một bản cập nhật gia tăng so với GPT-3.5, nhưng về tổng thể, đó là một chiến thắng lớn cho AI. Khi mô hình trở nên dễ tiếp cận hơn, cho cả người dùng bình thường và nhà phát triển thông qua API của nó, có vẻ như nó sẽ tạo ra một trường hợp tốt cho việc triển khai LLM trên các lĩnh vực.