10 tác động tích cực và tiêu cực của các mô hình ngôn ngữ AI nguồn mở
Trong khi phần mềm độc quyền như GPT và PaLM thống trị thị trường, thay vào đó, nhiều nhà phát triển thấy giá trị trong các mô hình ngôn ngữ nguồn mở. Lấy Meta làm ví dụ. Nó đã gây chú ý vào tháng 2 năm 2023 khi chính thức phát hành mô hình ngôn ngữ lớn LLaMA dưới dạng một chương trình nguồn mở. Không có gì ngạc nhiên khi quyết định này vấp phải nhiều phản ứng trái chiều.
Vì các mô hình ngôn ngữ nguồn mở có nhiều ưu và nhược điểm và có thể ảnh hưởng tích cực cũng như tiêu cực đến ngành công nghiệp AI, chúng tôi đã tóm tắt những điểm chính mà bạn nên biết và hiểu.
Mục Lục
5 tác động tích cực của các mô hình ngôn ngữ mã nguồn mở
Các mô hình ngôn ngữ nguồn mở thúc đẩy một cách tiếp cận hợp tác. Đầu vào, đánh giá và các trường hợp sử dụng từ các nhà phát triển trên toàn thế giới được cho là giúp họ thăng tiến nhanh hơn so với các dự án đã đóng.
1. Nhà phát triển AI tiết kiệm tài nguyên bằng cách sử dụng các mô hình nguồn mở
Việc khởi chạy các mô hình ngôn ngữ độc quyền tiêu tốn hàng triệu, nếu không muốn nói là hàng tỷ tài nguyên. Lấy OpenAI làm ví dụ. Business Insider báo cáo rằng công ty đã phải huy động khoảng 30 tỷ đô la để vận hành ChatGPT một cách hiệu quả. Có được nhiều tài trợ là không thể đối với hầu hết các công ty. Các công ty khởi nghiệp công nghệ trong giai đoạn đầu của họ sẽ may mắn đạt được thậm chí bảy chữ số.
Xem xét chi phí cao, thay vào đó, nhiều nhà phát triển sử dụng các mô hình ngôn ngữ nguồn mở. Họ tiết kiệm hàng triệu USD bằng cách sử dụng kiến trúc, cấu trúc thần kinh, dữ liệu đào tạo, thuật toán, triển khai mã và tập dữ liệu đào tạo của các hệ thống này.
2. Các mô hình nguồn mở được cho là phát triển nhanh hơn
Nhiều nhà lãnh đạo công nghệ lập luận rằng các mô hình ngôn ngữ nguồn mở phát triển nhanh hơn so với các đối tác độc quyền. Họ đánh giá cao sự đóng góp và cộng tác của cộng đồng. Hàng triệu nhà phát triển lành nghề đang làm việc trên các dự án mở—về mặt lý thuyết, họ có thể đạt được một phép lặp phức tạp, không có lỗi nhanh hơn nhiều.
Việc lấp đầy lỗ hổng kiến thức cũng nhanh hơn với AI mã nguồn mở. Thay vì đào tạo các nhóm để tìm lỗi, kiểm tra các bản cập nhật và khám phá các triển khai, các công ty có thể phân tích các đóng góp của cộng đồng. Chia sẻ kiến thức cho phép người dùng làm việc hiệu quả hơn.
Đóng góp của cộng đồng không phải lúc nào cũng chính xác. Các nhà phát triển vẫn nên kiểm tra lại các thuật toán và mô hình trước khi tích hợp chúng vào hệ thống của họ.
3. Nhà phát triển sẽ phát hiện lỗ hổng nhanh hơn
Các mô hình ngôn ngữ nguồn mở khuyến khích đánh giá ngang hàng và tham gia tích cực trong cộng đồng hợp tác của nó. Các nhà phát triển có thể tự do truy cập các thay đổi cơ sở mã. Với rất nhiều người dùng đang phân tích các dự án đang mở, họ có thể sẽ phát hiện ra các vấn đề bảo mật, lỗ hổng và lỗi hệ thống nhanh hơn.
Tương tự như vậy, giải quyết lỗi cũng được sắp xếp hợp lý. Thay vì giải quyết các sự cố hệ thống theo cách thủ công, nhà phát triển có thể kiểm tra hệ thống kiểm soát phiên bản của dự án để biết các bản sửa lỗi trước đó. Một số mục có thể đã lỗi thời. Tuy nhiên, họ vẫn sẽ cung cấp cho các nhà nghiên cứu và huấn luyện viên AI một điểm khởi đầu hữu ích.
4. Các nhà lãnh đạo công nghệ AI học hỏi từ các mô hình nguồn mở
Các mô hình ngôn ngữ nguồn mở được hưởng lợi từ vòng lặp phản hồi. Vòng lặp phản hồi tích cực chia sẻ các thuật toán, bộ dữ liệu và chức năng hiệu quả, khuyến khích các nhà phát triển bắt chước những điều này. Quá trình này giúp họ tiết kiệm rất nhiều thời gian. Chỉ cần lưu ý rằng các lỗi có thể phát sinh với phản hồi tích cực mà người dùng sao chép một cách ngẫu nhiên—các lỗi có xu hướng bị bỏ qua.
Trong khi đó, vòng lặp phản hồi tiêu cực tập trung vào các lĩnh vực cần cải thiện. Quá trình này bao gồm việc chia sẻ thông tin chi tiết cá nhân trong khi giải quyết lỗi, thử nghiệm chức năng mới và khắc phục sự cố hệ thống.
5. Các nền tảng AI mã nguồn mở có được những bước tiến đầu tiên trên các hệ thống mới
Các công ty công nghệ không chia sẻ hệ thống ngôn ngữ hàng tỷ đô la vì lòng tốt. Mặc dù giấy phép nguồn mở cấp cho người dùng bên thứ ba quyền tự do sửa đổi và bán hệ thống, nhưng chúng có những hạn chế.
Các nhà phân phối thường tạo ra các điều kiện đảm bảo rằng họ giữ được một số quyền hạn. Bạn sẽ tìm thấy các quy tắc này trong các thỏa thuận cấp phép của chương trình nguồn mở—người dùng cuối hiếm khi nhận được 100% quyền hạn.
Giả sử Meta muốn kiểm soát các sản phẩm do LLaMA cung cấp. Nhóm pháp lý của nó có thể chỉ định rằng Meta bảo lưu quyền đầu tư vào bất kỳ hệ thống mới nào được xây dựng trên mô hình ngôn ngữ của nó.
Nhưng đừng hiểu lầm—các nhà phát triển và nhà phân phối bên thứ ba vẫn hình thành các thỏa thuận đôi bên cùng có lợi. Sau này cung cấp các công nghệ và hệ thống trị giá hàng tỷ đô la. Trong khi đó, các công ty khởi nghiệp và nhà phát triển độc lập khám phá các cách triển khai chúng vào các ứng dụng khác nhau.
5 tác động tiêu cực của các mô hình ngôn ngữ mã nguồn mở
Các mô hình ngôn ngữ nguồn mở vốn đã không thiên vị, nhưng con người thì không. Người tiêu dùng, nhà phát triển và công ty có mục đích xấu có thể khai thác bản chất mở của các hệ thống này để thu lợi cá nhân.
1. Các công ty đang tùy tiện tham gia cuộc đua AI
Các công ty hiện đang phải đối mặt với quá nhiều áp lực khi tham gia cuộc đua AI. Với sự phổ biến của các hệ thống AI, nhiều công ty lo sợ rằng họ sẽ trở nên lỗi thời nếu không áp dụng AI. Kết quả là, các thương hiệu tùy tiện nhảy vào cuộc. Họ tích hợp các mô hình ngôn ngữ nguồn mở vào các sản phẩm của mình vì mục đích bán sản phẩm và theo kịp đối thủ, ngay cả khi chúng không cung cấp thứ gì có giá trị.
Vâng, AI là một thị trường mới nổi nhanh chóng. Tuy nhiên, việc phát hành một cách bất cẩn các hệ thống tinh vi nhưng không an toàn sẽ gây tổn hại cho ngành và ảnh hưởng đến sự an toàn của người tiêu dùng. Các nhà phát triển nên sử dụng AI để giải quyết vấn đề chứ không phải chạy các mánh lới quảng cáo tiếp thị.
2. Người tiêu dùng được tiếp cận với công nghệ mà họ hầu như không hiểu
Bạn sẽ tìm thấy các biến thể dựa trên AI của nhiều công cụ công nghệ khác nhau, từ trình chỉnh sửa hình ảnh trực tuyến đến các ứng dụng theo dõi sức khỏe. Và các thương hiệu sẽ tiếp tục giới thiệu các hệ thống mới khi AI phát triển. Các mô hình AI giúp họ cung cấp các phiên bản lặp lại tập trung vào người dùng, tùy chỉnh hơn cho các nền tảng hiện có của họ.
Trong khi ngành công nghệ hoan nghênh những đổi mới, sự phát triển nhanh chóng của AI vượt xa khả năng giáo dục người dùng. Người tiêu dùng đang được tiếp cận với những công nghệ mà họ hầu như không hiểu. Việc thiếu giáo dục tạo ra lỗ hổng lớn về kiến thức, khiến công chúng dễ bị đe dọa an ninh mạng và các hành vi săn mồi.
Các thương hiệu nên ưu tiên đào tạo nhiều như phát triển sản phẩm. Họ phải giúp người dùng hiểu các cách an toàn, có trách nhiệm để sử dụng các công cụ mạnh mẽ dựa trên AI.
3. Không phải tất cả các nhà phát triển đều có ý định tốt
Không phải ai cũng sử dụng các công cụ AI cho mục đích đã định. Chẳng hạn, OpenAI đã phát triển ChatGPT để trả lời các câu hỏi kiến thức chung an toàn cho công việc và sao chép đầu ra ngôn ngữ tự nhiên, nhưng tội phạm khai thác nó cho các hoạt động bất hợp pháp. Đã có một số vụ lừa đảo ChatGPT kể từ khi chatbot AI ra mắt vào tháng 11 năm 2022.
Ngay cả khi các phòng thí nghiệm AI thực thi các hạn chế cứng nhắc, kẻ gian vẫn sẽ tìm cách vượt qua chúng. Lại lấy ChatGPT làm ví dụ. Người dùng khắc phục các ràng buộc và thực hiện các tác vụ bị cấm bằng cách sử dụng lời nhắc bẻ khóa ChatGPT.
Các cuộc hội thoại dưới đây chứng minh những lỗ hổng này. ChatGPT có bộ dữ liệu hạn chế; do đó, nó không thể đưa ra dự đoán về các sự kiện không ổn định, không chắc chắn.
Bất chấp những hạn chế của nó, ChatGPT đã thực hiện yêu cầu của chúng tôi và đưa ra những dự đoán vô căn cứ sau khi bẻ khóa nó.
4. Các tổ chức có thể gặp khó khăn trong việc điều chỉnh AI nguồn mở
Các cơ quan quản lý đang phải vật lộn để theo kịp AI và sự phổ biến của các mô hình nguồn mở chỉ khiến việc giám sát trở nên khó khăn hơn. Những tiến bộ của AI đã vượt xa các khuôn khổ quy định. Ngay cả những nhà lãnh đạo công nghệ toàn cầu như Elon Musk, Bill Gates và Sam Altman cũng đang kêu gọi quy định chặt chẽ hơn về AI.
Các khu vực tư nhân và chính phủ đều phải kiểm soát các hệ thống này. Nếu không, những cá nhân ác ý sẽ tiếp tục khai thác chúng để vi phạm luật bảo mật dữ liệu, thực hiện hành vi trộm cắp danh tính và lừa đảo nạn nhân, cùng các hoạt động bất hợp pháp khác.
5. Rào cản gia nhập thấp hơn cản trở chất lượng
Sự phổ biến của các mô hình ngôn ngữ nguồn mở làm giảm các rào cản gia nhập để tham gia cuộc đua AI. Bạn sẽ tìm thấy hàng nghìn công cụ dựa trên AI trực tuyến.
Việc chứng kiến các công ty áp dụng máy móc và học sâu có vẻ ấn tượng, nhưng rất ít công ty mang lại bất kỳ giá trị thực tế nào. Hầu hết chỉ sao chép đối thủ cạnh tranh của họ. Theo thời gian, khả năng tiếp cận của các mô hình ngôn ngữ phức tạp và bộ dữ liệu đào tạo có thể biến các nền tảng AI vô nghĩa thành hàng hóa.
Tác động tổng thể của các mô hình ngôn ngữ nguồn mở đối với ngành công nghiệp AI
Mặc dù các mô hình ngôn ngữ nguồn mở giúp công nghệ AI dễ tiếp cận hơn, nhưng chúng cũng tiềm ẩn một số rủi ro bảo mật. Các nhà phát triển nên đặt ra các hạn chế chặt chẽ hơn. Nếu không, kẻ gian sẽ tiếp tục khai thác kiến trúc trong suốt của các hệ thống này.
Điều đó nói rằng, người tiêu dùng không hoàn toàn không có khả năng tự vệ trước các trò gian lận AI. Tự làm quen với những cách phổ biến mà kẻ gian khai thác các công cụ AI tổng quát và nghiên cứu các dấu hiệu cảnh báo về các cuộc tấn công. Bạn có thể chống lại hầu hết các tội phạm mạng bằng cách luôn cảnh giác.