/ / GPT-4 so với GPT-3.5: Giải thích 5 điểm khác biệt chính

GPT-4 so với GPT-3.5: Giải thích 5 điểm khác biệt chính

Sau tất cả những đồn đoán và tuyên bố về khả năng của GPT-4, phiên bản thứ tư được mong đợi nhiều của nhóm mô hình ngôn ngữ GPT đã ra mắt vào ngày 14 tháng 3 năm 2023.


GPT-4 không đi kèm với một số tính năng được quảng cáo rầm rộ mà nó được đồn đại là có. Tuy nhiên, mô hình mới nhất cải thiện đáng kể trên GPT-3.5 và các phiên bản tiền nhiệm của nó. Nhưng GPT-4 khác với GPT-3.5 như thế nào? Chúng tôi sẽ giới thiệu cho bạn một số điểm khác biệt chính giữa GPT-4 và GPT-3.5.


1. GPT-4 so với GPT-3.5: Sáng tạo

mô hình ngôn ngữ gpt-4 với logo OpenAI

Một trong những lợi thế rõ rệt nhất của mô hình GPT-4 so với GPT-3.5 là khả năng đưa ra các câu trả lời sáng tạo hơn cho các lời nhắc. Đừng hiểu lầm tôi; GPT-3.5 rất sáng tạo. Có một danh sách dài những điều sáng tạo mà bạn có thể thực hiện với ChatGPT sử dụng mô hình này. Tuy nhiên, nó đã vượt trội hơn nhiều mô hình ngôn ngữ lớn về tính sáng tạo.

Tuy nhiên, GPT-4 còn nâng tầm hơn nữa. Mặc dù lợi thế sáng tạo của GPT-4 có thể không rõ ràng khi cố gắng giải quyết các vấn đề cơ bản, nhưng sự khác biệt về khả năng sáng tạo giữa cả hai mô hình trở nên rõ ràng khi nhiệm vụ trở nên khó hơn và đòi hỏi mức độ sáng tạo cao hơn.

Ví dụ: nếu bạn yêu cầu cả hai mẫu hoàn thành một nhiệm vụ sáng tạo như viết một bài thơ bằng cả tiếng Anh và tiếng Pháp trên mỗi dòng của bài thơ, ChatGPT do mẫu GPT-4 mới nhất cung cấp sẽ mang lại kết quả tốt hơn. Mặc dù phản hồi của GPT-4 sẽ sử dụng cả hai ngôn ngữ trên mỗi dòng, nhưng thay vào đó, GPT-3.5 sẽ luân phiên giữa cả hai ngôn ngữ, với mỗi dòng sử dụng một ngôn ngữ và dòng tiếp theo sử dụng ngôn ngữ kia.

2. GPT-4 so với GPT-3.5: Đầu vào hình ảnh hoặc hình ảnh

Hình ảnh mạch điện và đầu người

Mặc dù GPT-3.5 chỉ có thể chấp nhận lời nhắc văn bản, nhưng GPT-4 là đa phương thức và có thể chấp nhận cả đầu vào văn bản và hình ảnh. Nói rõ hơn, khi chúng ta nói đầu vào trực quan, hình ảnh không nhất thiết phải là hình ảnh của lời nhắc đã nhập—nó có thể là hình ảnh của bất kỳ thứ gì. Vì vậy, từ một hình ảnh của một bài toán viết tay đến các meme Reddit, GPT-4 có thể hiểu và mô tả hầu hết mọi hình ảnh.

Không giống như GPT-3, GPT-4 vừa là ngôn ngữ vừa là mô hình trực quan.

Trong buổi phát trực tiếp thông báo về GPT-4, một kỹ sư OpenAI đã cung cấp cho mô hình một ảnh chụp màn hình của máy chủ Discord. GPT-4 có thể mô tả mọi chi tiết trên đó, bao gồm tên của những người dùng trực tuyến vào thời điểm đó. Một hình ảnh mô phỏng vẽ tay của một trang web trò đùa cũng được cung cấp cho mô hình với các hướng dẫn để biến nó thành một trang web và thật ngạc nhiên, GPT-4 đã cung cấp một mã hoạt động cho một trang web phù hợp với hình ảnh.

3. GPT-4 so với GPT-3.5: Phản hồi an toàn hơn

Hình ảnh Lá chắn Đại diện cho An ninh mạng

Mặc dù GPT-4 không hoàn hảo nhưng các biện pháp mà nó áp dụng để đảm bảo phản hồi an toàn hơn là một bản nâng cấp đáng hoan nghênh so với mô hình GPT-3.5. Với GPT-3.5, OpenAI đã thực hiện một cách tiếp cận an toàn dựa trên sự kiểm duyệt hơn. Nói cách khác, một số biện pháp an toàn đã được suy nghĩ lại nhiều hơn. OpenAI theo dõi những gì người dùng đã làm và các câu hỏi họ hỏi, xác định các lỗi và cố gắng khắc phục chúng khi đang di chuyển.

Với GPT-4, hầu hết các biện pháp an toàn đã được đưa vào hệ thống ở cấp mô hình. Để hiểu được sự khác biệt, nó giống như việc xây dựng một ngôi nhà bằng những vật liệu chắc chắn ngay từ đầu so với việc sử dụng bất cứ thứ gì có thể sử dụng được và sau đó cố gắng sửa chữa mọi thứ khi lỗi xuất hiện. Theo báo cáo kỹ thuật GPT-4 của OpenAI [PDF]GPT-4 chỉ tạo ra phản hồi độc hại 0,73% thời gian so với 6,48% phản hồi độc hại của GPT-3.5.

4. GPT-4 so với GPT-3.5: Tính thực tế của phản hồi

Một dòng chữ thực tế trên bốn khối lập phương

Một trong những sai sót của GPT-3.5 là xu hướng tạo ra thông tin vô nghĩa và không trung thực một cách tự tin. Trong biệt ngữ AI, điều này được gọi là “ảo giác AI” và có thể gây mất lòng tin vào thông tin do AI tạo ra.

​ ​

Trong GPT-4, ảo giác vẫn là một vấn đề. Tuy nhiên, theo báo cáo kỹ thuật của GPT-4, mô hình mới có khả năng gây ảo giác thấp hơn từ 19% đến 29% so với mô hình GPT-3.5. Nhưng đây không chỉ là về báo cáo kỹ thuật. Phản hồi từ mô hình GPT-4 trên ChatGPT thực tế hơn đáng kể.

5. GPT-4 so với GPT-3.5: Cửa sổ ngữ cảnh

Một cặp lập trình viên đang ngồi trong văn phòng xem xét một số mã.

Một điểm khác biệt ít được nói đến giữa GPT-4 và GPT-3.5 là cửa sổ ngữ cảnh và kích thước ngữ cảnh. Cửa sổ ngữ cảnh là lượng dữ liệu mà một mô hình có thể giữ lại trong “bộ nhớ” của nó trong phiên trò chuyện và trong bao lâu. GPT-4 có kích thước ngữ cảnh và cửa sổ tốt hơn đáng kể so với mẫu tiền thân của nó.

Về mặt thực tế, điều này có nghĩa là GPT-4 có thể nhớ ngữ cảnh của cuộc trò chuyện lâu hơn, cũng như các hướng dẫn được đưa ra trong cuộc trò chuyện.

Một vấn đề với GPT-3.5 là mô hình có xu hướng lạc đề hoặc không tuân theo hướng dẫn khi bạn tiến hành trong quá trình trò chuyện. Ví dụ, bạn có thể yêu cầu mô hình gọi bạn bằng tên của bạn và nó sẽ làm như vậy trong một thời gian nhưng sau đó không thực hiện theo các hướng dẫn trên đường đi. Mặc dù sự cố này vẫn tồn tại với kiểu máy GPT-4, nhưng vấn đề này ít hơn do có cửa sổ ngữ cảnh tốt hơn.

Một vấn đề khác là giới hạn về khối lượng văn bản mà bạn có thể sử dụng trong lời nhắc cùng một lúc. Tóm tắt văn bản dài bằng GPT-3 thường có nghĩa là chia văn bản thành nhiều phần và tóm tắt chúng từng chút một. Sự cải thiện về độ dài ngữ cảnh trong mô hình GPT-4 có nghĩa là bạn có thể dán toàn bộ tệp PDF một lần và lấy mô hình để tóm tắt mà không cần chia mô hình thành nhiều phần.

GPT-4: Bước tiến từ GPT-3.5

Không còn nghi ngờ gì nữa, GPT-4 là một bước tiến đáng kể so với các mẫu máy tiền nhiệm của nó. Mặc dù vẫn còn gặp phải một số hạn chế của GPT-3.5, nhưng những cải tiến đáng kể trong một số lĩnh vực và việc bổ sung các chức năng mới khiến mô hình này trở thành một bước tiến mới thú vị trong quá trình theo đuổi các mô hình ngôn ngữ AI thực sự thông minh.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *