Trí tuệ nhân tạo là gì?
ChatGPT, Bing AI và Google Bard là một số cái tên dễ nhận biết nhất trong thế giới trí tuệ nhân tạo tiêu dùng. Cả ba sản phẩm đều có một điểm chung — chúng đều là sản phẩm AI sáng tạo.
Nhưng chính xác thì AI tổng quát là gì và điều gì đã khơi dậy niềm đam mê gần đây với không gian AI đang hồi sinh này?
Mục Lục
Trí tuệ nhân tạo là gì?
AI sáng tạo, viết tắt của “trí tuệ nhân tạo sáng tạo”, là một loại hệ thống AI có thể tạo nội dung độc đáo hoặc nguyên bản như văn bản, âm thanh, video hoặc hình ảnh theo yêu cầu. Không giống như một số hệ thống AI truyền thống được thiết kế cho các tác vụ như phân loại hoặc phân tích dữ liệu, các mô hình AI tổng quát quan tâm nhiều hơn đến việc tạo ra các kết quả đầu ra mới lạ hoặc sáng tạo dựa trên các hướng dẫn mà chúng được cung cấp.
Mặc dù AI tổng quát có vẻ giống như một công nghệ mới, nhưng nó thực sự đã tồn tại hàng thập kỷ. Một số lần lặp lại và các hình thức đã xuất hiện ít nhất là vào đầu những năm 1960. Trí tuệ nhân tạo là một lĩnh vực rộng lớn và AI tổng quát chỉ là một phần phụ.
Một trong những khía cạnh hấp dẫn nhất của việc sử dụng công cụ AI tổng quát như ChatGPT hoặc Bard AI của Google là khả năng của những công cụ này tạo nội dung phù hợp với yêu cầu của bạn. Bạn yêu cầu ChatGPT viết một bài thơ theo phong cách của William Shakespeare, và bạn sẽ nhận được một thứ gì đó rất giống với tác phẩm của Shakespeare. Bạn yêu cầu nó tạo một bài phát biểu theo phong cách của Donald Trump, và bạn sẽ nhận được thứ gì đó mô phỏng giọng điệu của cựu tổng thống Mỹ một cách ấn tượng. Vậy làm thế nào có thể như vậy? Làm thế nào mà trí tuệ nhân tạo có thể tạo ra một kỳ tích hấp dẫn như vậy?
Cách thức hoạt động của AI sáng tạo
Cơ chế hoạt động của một mô hình AI tổng quát liên quan đến sự tương tác phức tạp của nhiều kỹ thuật và thuật toán học sâu khác nhau. Các chi tiết chính xác về cách thức hoạt động của một mô hình tổng quát phụ thuộc vào mục tiêu của nó và kiến trúc cơ bản. Chẳng hạn, một mô hình chung để tạo các đoạn âm thanh sẽ có cơ chế hoạt động khác với cơ chế dùng để tạo video hoặc văn bản.
Tuy nhiên, về cốt lõi, hầu hết, nếu không muốn nói là tất cả, các mô hình tổng quát hoạt động tương tự ở cấp độ cơ bản của chúng. Họ học hỏi từ một lượng lớn dữ liệu, nắm bắt các mẫu và kiểu dữ liệu, sau đó sử dụng các mẫu đã nắm bắt này để tái tạo các mẫu giống với những gì họ đã học được trong dữ liệu đào tạo của mình.
Bạn có thể coi các công cụ AI tổng quát như một nhà soạn nhạc. Hãy tưởng tượng nhà soạn nhạc này đã nghe vô số bài hát và nghiên cứu về hòa âm, giai điệu, nhịp điệu và cấu trúc của một số thể loại âm nhạc. Nói cách khác, nhà soạn nhạc này có kiến thức sâu rộng về các thể loại âm nhạc. Với kiến thức này, nhà soạn nhạc có thể tạo ra âm nhạc nguyên bản hoặc độc đáo lấy cảm hứng từ những gì họ đã học được.
Vì vậy, nếu họ đã học được nhiều về nhạc pop, bạn có thể yêu cầu họ sáng tác một bài hát pop và họ sẽ không gặp vấn đề gì khi làm như vậy. Âm nhạc được sáng tác sau đó sẽ là sự thể hiện sự hiểu biết của nhà soạn nhạc về nhạc pop sẽ trông như thế nào dựa trên những gì họ đã học được. Tương tự, sản phẩm của AI tổng quát là sự thể hiện sự hiểu biết của mô hình AI về các khái niệm cơ bản học được từ dữ liệu đào tạo của nó.
Vì vậy, nếu bạn muốn tạo một mô hình AI tổng quát tạo ra hình ảnh ô tô, bạn phải cung cấp cho mô hình một tập dữ liệu khổng lồ về hình ảnh ô tô. Để tạo ra một mô hình ấn tượng, bạn cần cung cấp cho nó hình ảnh của nhiều thương hiệu và kiểu xe ô tô mà bạn có thể nghĩ ra. Nếu được đào tạo đầy đủ, thuật toán sẽ tìm hiểu xem mỗi thương hiệu hoặc mẫu ô tô trông như thế nào và chúng tôi sẽ có thể tạo hình ảnh của hầu hết mọi ô tô mà bạn có thể nghĩ ra theo yêu cầu.
Các mô hình AI sáng tạo phổ biến
Có hàng trăm mô hình AI tổng quát hiện đang được phát triển hoặc đã được triển khai trên thị trường AI tiêu dùng. Một số trong những cái phổ biến bạn nên biết bao gồm:
1. Máy biến áp được đào tạo trước (GPT)
GPT, được phát triển bởi OpenAI, là một trong những cái tên dễ nhận biết nhất trong không gian AI tổng quát. Mức độ phổ biến của nó phụ thuộc vào hiệu quả của nó như một mô hình AI đàm thoại và sự thành công lan truyền của chatbot ChatGPT, sử dụng GPT làm công nghệ cơ bản. Nó là một mô hình ngôn ngữ lớn được thiết kế để tạo văn bản giống con người khi được nhắc. Điển hình của bất kỳ mô hình AI tổng quát nào, tất cả các lần lặp lại của mô hình GPT đã được đào tạo trên một lượng lớn dữ liệu văn bản đa dạng.
2. Mô hình Ngôn ngữ Lộ trình (PaLM)
PaLM, một mô hình ngôn ngữ lớn thử nghiệm của Google, là một mô hình AI tổng quát mạnh mẽ có khả năng thực hiện nhiều tác vụ như viết sáng tạo, tạo mã, dịch ngôn ngữ và một số tác vụ ngôn ngữ tự nhiên dựa trên văn bản khác. Giống như GPT, PaLM được đào tạo trên một kho dữ liệu văn bản lớn có nguồn gốc từ nhiều nguồn khác nhau trên web. Đây là mô hình AI cung cấp năng lượng cho Bard AI của Google.
3. Mô hình ngôn ngữ âm nhạc (MusicLM)
MusicLM là một mô hình AI tổng quát khác của Google. Nó được thiết kế để tạo nhạc “độ trung thực cao” từ lời nhắc văn bản đơn giản. Được đào tạo qua hàng nghìn giờ âm nhạc thuộc nhiều thể loại khác nhau, mô hình thế hệ mới có thể tạo ra âm nhạc độc đáo bằng cách sử dụng các mô tả đơn giản về âm nhạc bạn cần làm đầu vào. Nếu bạn đang tự hỏi nó tốt như thế nào, thì đây là bài đánh giá của chúng tôi về mô hình MusicLM.
4. DALL-E
DALL-E là mô hình tạo hình ảnh AI của OpenAI được thiết kế để tạo nhiều kiểu hình ảnh độc đáo từ lời nhắc văn bản. Đây là một triển khai đa phương thức của mô hình GPT, được đào tạo dựa trên nhiều cặp văn bản-hình ảnh từ nhiều nguồn khác nhau trên internet.
Ngoài các mô hình AI tổng quát, bạn cũng sẽ tìm thấy các sản phẩm AI tổng quát như Midjourney, trình tạo hình ảnh DALL-E, trình tạo hình ảnh Khuếch tán ổn định, Hugging Chat và một số sản phẩm AI ấn tượng khác được cung cấp bởi các mô hình AI tổng quát.
Tại sao AI sáng tạo lại bùng nổ về mức độ phổ biến?
Vào ngày 30 tháng 11 năm 2022, Giám đốc điều hành OpenAI Sam Altman đã thông báo về việc ra mắt ChatGPT trong một tweet. Mặc dù là Giám đốc điều hành của OpenAI, Altman tương đối ít được biết đến trong cộng đồng internet lớn hơn và dòng tweet của anh ấy xuất hiện rất ít hoặc không phô trương.
Năm ngày sau, ChatGPT đã thu hút được một triệu người dùng đầu tiên; nó đã làm như vậy với tốc độ chưa từng có đối với bất kỳ ứng dụng nào. Nó đã thu thập được thêm vài triệu, cuối cùng biến ChatGPT trở thành ứng dụng phát triển nhanh nhất mọi thời đại. Mặc dù ChatGPT không phải là sản phẩm AI tổng quát đầu tiên, nhưng sự xuất hiện của nó trong bối cảnh sản phẩm AI đã đưa AI tổng quát vào nhận thức của công chúng nhiều hơn bất kỳ sản phẩm công nghệ nào khác trước đó.
Mặc dù ChatGPT là mũi nhọn trong việc thúc đẩy sự cường điệu xung quanh AI sáng tạo, nhưng nó không làm được điều đó một mình. Năm 2022 sẽ được ghi nhớ là năm các công cụ AI sáng tạo trở thành xu hướng. Từ các chatbot AI đàm thoại đến các trình tạo mã và nghệ thuật, nửa cuối năm 2022 là lần đầu tiên nhiều công cụ AI có cả sức hấp dẫn đại chúng và mục đích sử dụng thực tế hàng ngày được tung ra thị trường. Với những công cụ này, công nghệ nền tảng của nó đã trở nên phổ biến—trí thông minh nhân tạo (generative AI).
Các công cụ AI sáng tạo như Bing AI, Google’s Bard, DALL-E, ChatGPT và Midjourney đã liên tục đan xen vào kết cấu cuộc sống hàng ngày của chúng ta, liên tục giới thiệu cho chúng ta những sáng tạo đáng chú ý của chúng. Cho dù đó là những bài viết hấp dẫn do ChatGPT tạo ra hay những hình ảnh sống động như thật đáng kinh ngạc do Midjourney tạo ra, thì AI sáng tạo đã trở thành người bạn đồng hành luôn hiện diện, đồng hành cùng chúng ta ngày này qua ngày khác. Đây là nguồn gốc của sự phổ biến gần đây của AI tổng quát.
Nắm bắt AI sáng tạo
Sự phổ biến của các công cụ AI tổng quát không phải là mốt nhất thời. Không giống như một số xu hướng công nghệ gần đây đã trở nên phổ biến và nhanh chóng biến mất theo thời gian, AI tổng quát là một công nghệ mang lại những lợi ích thiết thực thực sự. Khi thị trường ngách công nghệ đang trỗi dậy này len lỏi vào hầu hết mọi khía cạnh của cuộc sống kỹ thuật số của chúng ta, tốt nhất bạn nên tìm cách tận dụng tốt nhất công nghệ này thay vì bối rối về nó.