/ / Llama 2 là gì và bạn có thể sử dụng nó như thế nào?

Llama 2 là gì và bạn có thể sử dụng nó như thế nào?

Từ GPT-4 của OpenAI đến PalM 2 của Google, các mô hình ngôn ngữ lớn thống trị các tiêu đề công nghệ. Mỗi mô hình mới hứa hẹn sẽ tốt hơn và mạnh hơn mô hình trước đó, đôi khi vượt qua bất kỳ đối thủ cạnh tranh hiện có nào.


Tuy nhiên, số lượng các mô hình hiện có không làm chậm sự xuất hiện của những mô hình mới. Giờ đây, công ty mẹ của Facebook, Meta, đã phát hành Llama 2, một mô hình ngôn ngữ mới mạnh mẽ. Nhưng Llama 2 có gì độc đáo? Nó khác với GPT-4, PaLM 2 và Claude 2 như thế nào và tại sao bạn nên quan tâm?


Llama 2 là gì?

minh họa lạc đà không bướu

Llama 2, một mô hình ngôn ngữ lớn, là sản phẩm của một liên minh không phổ biến giữa Meta và Microsoft, hai gã khổng lồ công nghệ cạnh tranh đi đầu trong nghiên cứu trí tuệ nhân tạo. Nó là sự kế thừa cho mô hình ngôn ngữ Llama 1 của Meta, được phát hành vào quý đầu tiên của năm 2023.

Bạn có thể nói nó tương đương với Meta của PaLM 2 của Google, OpenAIs GPT-4 và Anthropic’s Claude 2. Nó đã được đào tạo trên một bộ dữ liệu khổng lồ gồm dữ liệu internet có sẵn công khai, tận hưởng lợi thế của một bộ dữ liệu mới hơn và đa dạng hơn so với bộ dữ liệu được sử dụng để đào tạo Llama 1. Llama 2 được đào tạo với nhiều dữ liệu hơn 40% so với người tiền nhiệm của nó và có độ dài ngữ cảnh gấp đôi (4k).

Nếu trước đây bạn đã có cơ hội tương tác với Llama 1 nhưng không quá ấn tượng với kết quả đầu ra của nó, thì Llama 2 vượt trội so với người tiền nhiệm của nó và có thể chính là thứ bạn cần. Nhưng nó chống lại sự cạnh tranh bên ngoài như thế nào?

Làm thế nào để Llama 2 xếp chồng lên đối thủ cạnh tranh?

Minh họa ChatGPT so với Bing AI so với Bard

Vâng, nó phụ thuộc vào sự cạnh tranh mà nó chống lại. Thứ nhất, Llama 2 là một dự án mã nguồn mở. Điều này có nghĩa là Meta đang xuất bản toàn bộ mô hình để bất kỳ ai cũng có thể sử dụng nó để xây dựng các mô hình hoặc ứng dụng mới. Nếu bạn so sánh Llama 2 với các mô hình ngôn ngữ nguồn mở lớn khác như Falcon hoặc MBT, bạn sẽ thấy nó vượt trội hơn chúng ở một số chỉ số. Có thể nói Llama 2 là một trong những mô hình ngôn ngữ lớn nguồn mở mạnh mẽ nhất trên thị trường hiện nay.

Tuy nhiên, Llama 2 mất lợi thế khi phải đối mặt với những đối thủ như GPT của OpenAI và dòng mô hình AI PalM của Google. Khi xử lý các tác vụ đòi hỏi sự sáng tạo, Llama 2 có đôi chỗ. Tùy thuộc vào biến thể nào của nó mà bạn thử nghiệm, bạn có thể không nhận được đầu ra tương tự như khi bạn nhận được từ các mô hình như Anthropic và OpenAI.

Để bảo vệ nó, Llama 2 chủ yếu là một “mô hình cơ bản” chứ không phải là một “tinh chỉnh”. Các mô hình nền tảng là các mô hình ngôn ngữ lớn được xây dựng có tính đến khả năng thích ứng trong tương lai. Chúng không được tinh chỉnh cho bất kỳ lĩnh vực cụ thể nào mà được xây dựng để có thể giải quyết một loạt các nhiệm vụ, mặc dù, đôi khi, với khả năng hạn chế.

Mặt khác, một mô hình tinh chỉnh là một mô hình nền tảng được điều chỉnh để tăng hiệu quả của nó trong một lĩnh vực cụ thể. Nó giống như sử dụng một mô hình nền tảng như GPT và tinh chỉnh nó thành ChatGPT để công chúng có thể sử dụng nó.

Cách sử dụng Llama 2 ngay bây giờ

Mặc dù Llama 2 không khả dụng trên nền tảng công khai như ChatGPT, nhưng bạn vẫn có thể sở hữu mô hình bằng cách tải xuống bản sao của mô hình và chạy cục bộ hoặc sử dụng quyền truy cập thông qua phiên bản lưu trữ trên đám mây Hugging Face.

Để truy cập Llama trên Hugging Face, chỉ cần mở liên kết Hugging Face tương ứng bên dưới và bắt đầu nhắc AI chatbot.

  1. Thông số 7B trò chuyện Llama-2
  2. Thông số 13B chat Llama-2
  3. Thông số 70B chat Llama-2

Các mô hình Llama ở trên đã được tinh chỉnh cho các ứng dụng hội thoại, vì vậy đây là mô hình gần nhất với ChatGPT mà bạn sẽ nhận được cho mô hình Llama-2. Không chắc chắn nên thử phiên bản nào? Chúng tôi đề nghị tùy chọn ba, các tham số 70B trò chuyện Llama-2. Bạn vẫn có thể thử với cả ba kiểu máy để xem kiểu nào phù hợp nhất với nhu cầu riêng của mình.

Chúng tôi đã sử dụng trò chuyện Llama-2 tham số 70B của Meta để quay và kết quả thật ấn tượng. Để kiểm tra tính sáng tạo và khiếu hài hước của nó, chúng tôi đã cho nó bài kiểm tra tính sáng tạo và tính châm biếm đặc trưng của chúng tôi. Chúng tôi đã yêu cầu mô hình AI mô phỏng cuộc trò chuyện giữa hai người đang tranh luận về giá trị của việc đi vào vũ trụ và đây là kết quả.

Ôm mặt LlaMA Lập luận mỉa mai về không gian

Theo dõi bởi:

Ôm mặt LlaMA Lập luận mỉa mai về không gian 2

Và cuối cùng:

Ôm mặt LlaMA Lập luận mỉa mai về không gian 3

Nó không hiểu đúng tất cả các chi tiết trong hướng dẫn của chúng tôi, nhưng sự hài hước thật ấn tượng.

Mặt khác, nếu bạn có chuyên môn kỹ thuật để chạy mô hình Llama cục bộ trên máy của mình, bạn có thể yêu cầu quyền truy cập vào mô hình bằng biểu mẫu yêu cầu quyền truy cập Llama của Meta. Sau khi cung cấp tên, email, vị trí và tên tổ chức của bạn, Meta sẽ xem xét đơn đăng ký của bạn, sau đó quyền truy cập sẽ bị từ chối hoặc cấp quyền truy cập trong khoảng thời gian kéo dài từ vài giờ đến hai ngày. Quyền truy cập của tôi đã được cấp trong vài phút, vì vậy hy vọng bạn cũng gặp may mắn.

Llama 2: Bước quan trọng đầu tiên

Llama 2 có thể không phải là mô hình ngôn ngữ tinh vi nhất hiện có, nhưng nhờ là nguồn mở, nó thể hiện bước đầu tiên quan trọng hướng tới sự phát triển AI minh bạch và tiến bộ.

Mặc dù những thứ như OpenAI GPT hiện có hiệu suất tốt hơn, nhưng cách tiếp cận phát triển trong vườn có tường bao quanh của OpenAI có nghĩa là sự tăng trưởng và tốc độ phát triển của mô hình được kiểm soát bởi công ty. Với mô hình nguồn mở như Llama, cộng đồng nguồn mở rộng lớn hơn có thể đổi mới lặp đi lặp lại để xây dựng các sản phẩm mới có thể không thực hiện được trong hệ thống vườn có tường bao quanh.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *