Cách tạo nhạc AI với MusicGen của Meta
Meta đã phát hành mã cho MusicGen, một trình tạo nhạc AI khác có thể biến các mô tả văn bản thành các giai điệu âm nhạc. Bản demo có thể được tìm thấy trực tuyến và bạn chỉ cần một trình duyệt để dùng thử. Kết quả không tệ nhưng hơn thế nữa, nó cho thấy các mô hình âm nhạc AI đã tiến bộ đến mức nào.
Sau đây là những điều bạn cần biết về MusicGen và cách tạo nhạc.
Mục Lục
MusicGen là gì?
Vào tháng 6 năm 2023, Meta đã phát hành mô hình tạo nhạc AI có tên là MusicGen. Đây không phải là công ty đầu tiên giải quyết vấn đề phức tạp trong việc tổng hợp nhạc thô từ một mô tả văn bản đơn giản; cho đến nay, bạn có thể tạo nhạc bằng Jukebox của OpenAI hoặc tạo đoạn trích bài hát bằng MusicLM.
Nhưng đây là công ty đầu tiên tạo mã nguồn mở, cho phép bạn chạy phần mềm cục bộ trên máy tính của mình nếu bạn có GPU có bộ nhớ tối thiểu 16 GB—mặc dù chúng tôi có thể làm cho nó hoạt động chỉ với 11 GB.
Đừng lo lắng nếu bạn không có phần cứng, vì bạn có thể dùng thử ứng dụng web MusicGen miễn phí bằng trình duyệt. Từ bản trình diễn trực tuyến, bạn có thể mong đợi chỉ mất hơn một phút để tạo đoạn âm thanh dài khoảng 12 giây.
MusicGen có âm thanh như thế nào?
Theo Meta, MusicGen có thể tạo ra các mẫu nhạc chất lượng cao, mặc dù chúng tôi phát hiện ra rằng các nhà nghiên cứu liên quan đã xác định chất lượng cao là 32kHz. Điều này nằm ở đâu đó giữa các yêu cầu về tổng hợp giọng nói (16kHz) và tiêu chuẩn cho nhạc số (44,1kHz).
Trên thực tế, âm thanh không đáp ứng các tiêu chuẩn chất lượng tối thiểu mà bạn có thể quen nghe trên đài hoặc các nền tảng phát trực tuyến. Tuy nhiên, so với các trình tạo nhạc AI khác và xem xét công nghệ đang ở đâu tại thời điểm viết, chất lượng âm thanh khá tốt với độ ồn thấp trong tệp.
Âm nhạc phù hợp với lời nhắc đến mức nào? Bạn có thể nhanh chóng hiểu được điều đó bằng cách lắng nghe các ví dụ mà chúng tôi tạo ra bên dưới. Nhìn chung, nó quản lý để tuân thủ các thể loại âm nhạc phổ biến trong khi vẫn duy trì cấu trúc âm nhạc mạch lạc hơn so với những người tiền nhiệm của nó.
Cách tạo nhạc bằng MusicGen
MusicGen rất dễ sử dụng và không yêu cầu bạn phải đăng ký. Giao diện cũng đơn giản, giúp bạn dễ dàng dùng thử để giải trí.
Đây là cách tạo nhạc với MusicGen:
- Mở ứng dụng web MusicGen.
- Trong hộp văn bản có tiêu đề Mô tả âm nhạc của bạn, hãy nhập lời nhắc của bạn. Bạn có thể thử nội dung nào đó đơn giản như “Giai điệu dân ca Ireland” hoặc làm cho nội dung đó chi tiết hơn bằng cách thêm nhạc cụ, nhịp độ, thể loại hoặc cảm xúc.
- Nhấn nút Phát ra để bắt đầu quá trình. Sau một hoặc hai phút, trình phát âm thanh sẽ xuất hiện trong mô-đun Nhạc đã tạo ở bên phải.
- Di chuột qua mô-đun để hiển thị các nút điều khiển của trình phát và nghe tệp hoặc nhấn vào biểu tượng tải xuống ở góc trên cùng bên phải để lưu tệp vào máy tính của bạn. Lưu ý rằng nó chỉ có sẵn để tải xuống dưới dạng tệp .mp4.
- Nếu bạn muốn thử điều chỉnh kết quả bằng giai điệu hiện có, bạn có thể tải lên bản ghi âm trong mô-đun bên cạnh hộp văn bản. Ngoài ra, bạn có thể chọn Micrô để ghi lại giai điệu bằng micrô của bạn.
Điều chỉnh giai điệu sẽ sử dụng cả phần mô tả văn bản và giai điệu bạn cung cấp làm tài liệu tham khảo. Đây là một công cụ hữu ích để định hình kết quả bạn nhận được từ MusicGen.
Những hạn chế khi sử dụng MusicGen Audio là gì?
Mã cho MusicGen được phân phối miễn phí theo giấy phép MIT với một số hạn chế. Đối với âm thanh bạn tạo bằng mô hình, không rõ liệu có bất kỳ nguyên tắc pháp lý nào hay không. Thay vào đó, bạn có thể muốn chú ý đến cảnh báo của Meta khi sử dụng MusicGen:
“Không nên sử dụng mô hình này để cố ý tạo hoặc phổ biến các bản nhạc tạo ra môi trường thù địch hoặc xa lánh cho mọi người. Điều này bao gồm việc tạo ra âm nhạc mà mọi người có thể thấy trước là gây phiền nhiễu, đau khổ hoặc xúc phạm; hoặc nội dung truyền bá các khuôn mẫu lịch sử hoặc hiện tại.”
Meta giải thích thêm rằng MusicGen dành cho các nhà nghiên cứu muốn khám phá việc tạo nhạc AI chứ không phải cho “việc sử dụng xuôi dòng”, mà chúng tôi cho là có nghĩa là các hoạt động như tải lên và phân phối nhạc AI trên các nền tảng phát trực tuyến.
Những ưu và nhược điểm đạo đức phản ánh thế hệ nghệ thuật AI. Nhận được sự đồng ý sử dụng dữ liệu để đào tạo các mô hình AI, cộng với vấn đề đền bù/ghi công cho các nghệ sĩ khi thích hợp, là tất cả các lý do để Meta chơi an toàn.
Nói tóm lại, việc khám phá mô hình cho vui không có khả năng gây hại, nhưng nó có thể là một vấn đề nhức nhối hơn khi sử dụng âm thanh cho âm nhạc thương mại. Nhiều người đang tự hỏi tương lai của nhạc pop với AI sẽ như thế nào.
Thêm một mô hình tạo nhạc khác vào những thứ hiện có, Meta đã phát hành MusicGen, một mô hình AI mã nguồn mở có khả năng tạo nhạc thô từ một mô tả văn bản đơn giản. Nếu bạn tò mò về việc dùng thử công nghệ, bạn có thể dùng thử bản demo chỉ bằng một trình duyệt web.