8 công cụ dò tìm văn bản AI chính xác nhất mà bạn có thể thử
Khi các mô hình ngôn ngữ như GPT tiếp tục được cải thiện, việc phân biệt giữa văn bản do AI tạo ra và văn bản do con người viết ngày càng trở nên khó khăn hơn. Tuy nhiên, trong một số trường hợp, chẳng hạn như trong lĩnh vực học thuật, cần phải đảm bảo rằng văn bản không phải do AI viết.
Đây là lúc trình phát hiện văn bản AI phát huy tác dụng. Mặc dù không có công cụ nào hiện có phát hiện một cách chắc chắn hoàn toàn (và họ cũng không tuyên bố làm như vậy), một số công cụ trong số này cung cấp kết quả khá chính xác. Vì vậy, ở đây, chúng tôi liệt kê tám trình phát hiện văn bản AI chính xác nhất mà bạn có thể thử.
GPTZero được xây dựng để giúp giáo viên tìm hiểu xem bài làm do học sinh của họ gửi có được tạo bằng AI hay không. Nhưng vì GPTZero phát hiện chính xác nội dung do ChatGPT tạo nên bạn không nhất thiết phải là giáo viên mới có thể hưởng lợi từ nội dung đó.
GPTZero phân tích văn bản và cho biết liệu văn bản đó được viết bởi con người hay AI, làm nổi bật các câu cụ thể mà nó tin là do AI tạo ra. Nó cũng cung cấp điểm phức tạp và bùng nổ, là thước đo cho tính ngẫu nhiên và sự thay đổi trong tính ngẫu nhiên. Nói chung, những điểm số này cao đối với văn bản do con người viết và thấp đối với AI.
Để kiểm tra công cụ này, trước tiên, chúng tôi đã dán một đoạn trích từ Ngôi nhà của người lính của Ernest Hemingway. GPTZero đã đánh dấu một vài câu dưới dạng văn bản có khả năng do AI tạo ra. Tuy nhiên, nó có thể xác định chính xác văn bản do ChatGPT tạo ra là “được viết hoàn toàn bởi AI”.
Cuối cùng, chúng tôi đã nhập một đoạn trích từ văn bản do AI viết xen lẫn nội dung của con người. Thật đáng kinh ngạc, GPTZero đã xác định chính xác tất cả các câu được viết bởi AI. Nhưng nó cũng đánh dấu một vài cái do con người viết.
Nhìn chung, GPTZero phát hiện văn bản AI rất tốt nhưng cũng tạo ra kết quả dương tính giả. Công cụ này miễn phí và cũng có API.
OpenAI đã tạo Trình phân loại văn bản AI để chống lại mô hình GPT của chính nó. Mặc dù không hoàn toàn chính xác, Trình phân loại này vẫn có thể xác định văn bản AI. Không giống như các công cụ khác, Trình phân loại của OpenAI không cung cấp điểm số hoặc đánh dấu các câu do AI tạo.
Thay vào đó, nó cho biết khả năng nội dung do AI tạo ra bằng cách sử dụng năm danh mục từ rất khó xảy ra đến có khả năng xảy ra. Trình phân loại của OpenAI đã có thể nhận ra câu chuyện của Hemingway và đánh dấu nó là “không chắc được viết bởi AI”.
Tương tự, nó đã xác định chính xác một đoạn trích từ cuộc trò chuyện ChatGPT và gắn nhãn nó là “có khả năng do AI tạo ra”. Cuối cùng, nó đánh dấu sự kết hợp giữa văn bản của con người và AI là “không rõ ràng”, đây là tùy chọn phù hợp nhất trong số năm nhãn mà nó sử dụng.
Nội dung ở quy mô tự nó là một trình tạo văn bản AI tập trung vào việc sản xuất nội dung dạng dài với một vài cú nhấp chuột. Nó cũng có một công cụ phát hiện AI ấn tượng.
Nội dung tại Scale AI Detector cung cấp điểm số cho xác suất, mẫu và khả năng dự đoán, cùng với điểm tổng thể. Chúng được thể hiện dưới dạng phần trăm. Tỷ lệ phần trăm càng cao, càng có nhiều khả năng văn bản được viết bởi con người. Công cụ này cũng đánh dấu những câu mà nó tin là do AI viết.
Trong các thử nghiệm của chúng tôi, nó đã cho điểm 96% đối với nội dung do con người viết, 22% đối với văn bản của ChatGPT và 61% đối với sự kết hợp của cả hai. Nói về các câu cụ thể, nó gần như xác định tất cả các câu do AI viết. Tuy nhiên, giống như GPTZero, nó đã dán nhãn sai một số câu do con người viết là do AI tạo ra.
Công cụ này cũng miễn phí và tạo ra kết quả khá giống với GPTZero.
Originality AI là một trình phát hiện văn bản AI phổ biến tuyên bố sẽ phát hiện chính xác văn bản do GPT 3, GPT 3.5 và ChatGPT tạo ra. Nó đưa ra tỷ lệ phần trăm khả năng văn bản được tạo bởi con người hoặc AI.
Tính độc đáo AI đã đánh dấu văn bản do con người viết là 71% có khả năng được viết bởi con người, điều này không lý tưởng. Nhưng AI của Originality đã phát hiện chính xác câu trả lời của ChatGPT, gắn nhãn nó là 100% AI. Khi được yêu cầu phân tích hỗn hợp văn bản giữa con người và AI, Originality đã đánh dấu 94% là con người.
Vì vậy, mặc dù nó có thể phát hiện nội dung GPT, nhưng việc trộn nội dung đó với văn bản của con người khiến nó bối rối. Không giống như hầu hết các công cụ khác, Originality AI là một công cụ phát hiện trả phí. Tuy nhiên, nó cung cấp một số tín dụng để dùng thử nếu bạn tải xuống tiện ích mở rộng Chrome của nó.
Writefull nhằm mục đích làm cho bài viết học thuật dễ dàng hơn. Cuối cùng, nó có một số công cụ AI, bao gồm cả bộ phát hiện GPT. Công cụ này miễn phí sử dụng và mã hóa dữ liệu để đảm bảo quyền riêng tư.
Writefull GPT Detector có thể xác định nội dung được viết bởi GPT-3 cũng như ChatGPT. Sau khi phân tích, nó cung cấp điểm số cho biết xác suất nội dung được viết bởi AI.
Trong các thử nghiệm của chúng tôi, Writefull đã phát hiện chính xác văn bản do con người viết, cho điểm 1% (tức là 1% khả năng văn bản đó do AI tạo ra). Tương tự như vậy, nó đã cho điểm 100% cho văn bản của ChatGPT. Tuy nhiên, khi chúng tôi kết hợp nội dung do AI tạo với văn bản của con người, Writefull đã đánh dấu nội dung đó là “1% khả năng nội dung này đến từ GPT-3 hoặc ChatGPT”.
Vì vậy, mặc dù nó đã nhận ra AI và văn bản của con người một cách riêng lẻ, nhưng Writefull đã mắc lỗi khi chúng tôi kết hợp cả hai. Công cụ này cung cấp khả năng tích hợp với Word và Overleaf, đồng thời cũng có API cho Trình phát hiện GPT.
Hive Moderation không chỉ có một công cụ để phát hiện văn bản AI mà còn để phát hiện các hình ảnh do AI tạo ra.
Công cụ phát hiện văn bản đã phân tích chính xác văn bản do con người viết là “có khả năng chứa 0% văn bản AI”. Tương tự, văn bản do AI tạo ra cũng được xác định như vậy. Nhưng giống như hầu hết những người khác, nó không thể phát hiện sự kết hợp của cả hai văn bản một cách chính xác.
Trên trang web của nó, bạn có thể sử dụng công cụ demo miễn phí mà không cần đăng ký. Nhưng bạn sẽ phải liên hệ với họ để có quyền truy cập đầy đủ. Tương tự, trình phát hiện hình ảnh có thể giúp bạn phát hiện hình ảnh được tạo bởi các công cụ AI như DALL-E 2 hoặc Midjourney.
Paraphrasingtool.ai có trình phát hiện nội dung AI với hai tùy chọn: Phát hiện bởi Jarvis và Phát hiện bởi Veronica. Jarvis làm nổi bật các câu có khả năng do AI tạo ra, trong khi Veronica chỉ định một tỷ lệ phần trăm xác suất.
Trong thử nghiệm đầu tiên của chúng tôi, Detect của Jarvis đã đánh dấu sai một vài câu là do AI viết, trong khi Detect của Veronica cho thấy chính xác nội dung đó 100% do con người viết. Tuy nhiên, văn bản do ChatGPT viết đã được cả hai phát hiện chính xác.
Phát hiện của Jarvis hoạt động tốt hơn khi được yêu cầu phân tích văn bản kết hợp, làm nổi bật hầu hết các câu AI. Nhưng Veronica đã cho thấy nó là nội dung 100% của con người. Một công cụ miễn phí, AI Content Detector của Paraphrasingtool.ai, đã cung cấp kết quả khá tốt về tổng thể.
Copyleaks, một trong những công cụ phát hiện đạo văn phổ biến nhất, có một công cụ khác để phát hiện ChatGPT, GPT-3 và các mô hình ngôn ngữ tương tự khác. Điều làm cho nó nổi bật là nó có thể phát hiện nội dung được viết bằng các ngôn ngữ khác, như tiếng Tây Ban Nha và tiếng Pháp.
Công cụ này có thể xác định chính xác truyện ngắn của Ernest là do con người viết với xác suất khoảng 85%. Tương tự như vậy, nó đã phát hiện văn bản AI với độ chắc chắn 99,99%. Trường hợp nó mắc lỗi là sự kết hợp giữa AI và nội dung của con người, vì nó đánh dấu rằng 96% khả năng đó là văn bản của con người.
Trình phát hiện nội dung AI của Copyleaks có tiện ích mở rộng của Chrome. Trên hết, nó cung cấp tích hợp API và LMS.
Phát hiện văn bản do AI tạo chỉ bằng một cú nhấp chuột
Nhờ các công cụ nêu trên, bạn có thể phát hiện văn bản do AI viết khá dễ dàng. Tuy nhiên, những điều này vẫn còn lâu mới hoàn toàn chính xác. Chỉ cần thay đổi một vài câu là có thể đánh lừa được những máy dò này. Và một mối quan tâm nghiêm trọng hơn với những công cụ này là kết quả dương tính giả.
Ngay cả khi bạn không muốn phụ thuộc hoàn toàn vào những máy dò này, văn bản AI chứa một số dấu hiệu nhận biết mà bạn có thể nhận ra nếu chú ý một chút.