Jukebox của OpenAI là gì và bạn có thể làm gì với nó?
AI sáng tạo đang dần lan rộng sang các lĩnh vực ngày càng nhiều trong ngành công nghiệp sáng tạo. Nó bắt đầu với các trình tạo nghệ thuật AI và sau đó lan sang viết bằng văn bản do AI tạo. Bây giờ, chúng ta có thể thêm nhạc vào danh sách đó.
Trong tương lai gần, âm nhạc do AI tạo ra sẽ trở thành hiện thực. Trên thực tế, điều đó đã có thể xảy ra với Jukebox, mô hình AI tạo nhạc của OpenAI. Nó chưa có sẵn trong một ứng dụng dễ sử dụng và nghe có vẻ chưa đủ tốt, nhưng các thuật toán cơ bản đã có.
Đây là những gì bạn cần biết về OpenAI’s Jukebox và những gì bạn có thể làm với nó.
Mục Lục
Jukebox: AI tạo nhạc dưới dạng âm thanh thô
Jukebox là một mạng thần kinh có thể tạo nhạc ở dạng âm thanh thô khi bạn cung cấp thông tin đầu vào như thể loại, nghệ sĩ hoặc lời bài hát. Nó được phát hành vào tháng 4 năm 2020 bởi OpenAI, chính công ty đã mang đến cho chúng ta công cụ tạo nghệ thuật AI có tên Dall-E và chatbot AI có tên ChatGPT.
Không giống như Dall-E, thứ đã lan truyền nhanh chóng trên toàn thế giới và khiến AI trở thành một chủ đề gây sốt trên các phương tiện truyền thông và tin tức, Jukebox đã không thu hút được nhiều sự quan tâm sau khi phát hành. Một lý do cho điều này là nó không có ứng dụng web thân thiện với người dùng—ít nhất là chưa.
Bạn có thể tìm thấy mã trên trang web OpenAI, cùng với phần giải thích chuyên sâu về cách hoạt động của quy trình mã hóa và giải mã.
Một lý do có khả năng khác là nó cần một lượng lớn thời gian và sức mạnh tính toán. Để cung cấp cho bạn một ý tưởng, chỉ một phút âm thanh có thể mất 9 giờ để hiển thị. Bạn sẽ cần sẵn sàng khám phá mô hình ở dạng mã của nó, cộng với rất nhiều kiên nhẫn nếu bạn muốn xem mô hình AI có thể làm gì để tạo ra âm nhạc.
Hoặc, bạn có thể bỏ qua Jukebox Sample Explorer. Đây là nơi OpenAI đã đăng các thử nghiệm của mình từ việc tạo các bài hát giống như Ella Fitzgerald hoặc 2Pac.
Rõ ràng, các công cụ âm nhạc AI khác tồn tại để giúp bạn tạo một bài hát, nhưng chúng không tạo âm thanh từ đầu. Thay vào đó, chúng kết hợp các mẫu được ghi trước hoặc tạo thông tin MIDI được đưa qua bộ tổng hợp kỹ thuật số.
Jukebox có âm thanh như thế nào?
Kết quả của Jukebox có thể nhận ra nhưng kỳ lạ. Không khó để hiểu hình dạng của bài hát và thể loại của nó, nhưng chất lượng của kết quả khiến âm thanh như thể bạn đang nghe một số bản nhạc được ghi lại sớm nhất: nghĩa là bị bóp nghẹt bởi nhiều tạp âm.
Có thể nói rằng Jukebox không tạo ra loại âm thanh có độ trung thực cao mà bạn sẽ nghe thấy từ một cặp tai nghe tốt. Nó giống như nghe nhạc từ một đài phát thanh không được điều chỉnh đầy đủ theo đúng tần số. Một số bài hát được thể hiện lại trong khi những bài khác là phần tiếp theo của các bài hát hiện có. Ngoài ra còn có một danh mục dành cho các nghệ sĩ và phong cách mới lạ cũng như lời bài hát chưa từng thấy.
Bất chấp chất lượng âm thanh, những người thử nghiệm ban đầu mô tả họ bị kinh ngạc bởi vẻ đẹp kỳ lạ và bản chất kỳ lạ của âm nhạc do Jukebox tạo ra. Merzmench viết trên Medium: “Giống như một bản nhạc nền cho tài liệu về một quốc gia vô danh với một nền văn hóa vô danh”.
Hiện tại, kết quả còn lâu mới đủ tốt để sao chép, hoặc thậm chí thay thế, âm nhạc do con người tạo ra, nhưng công nghệ đang phát triển nhanh chóng và chẳng bao lâu nữa, các mô hình như Jukebox cũng sẽ có thể đạt được những kỳ tích đó.
Jukebox của OpenAI đã được đào tạo như thế nào
Một phần trong cách Jukebox có thể tạo ra thứ âm nhạc chưa từng tồn tại trước đây là nó được đào tạo dựa trên âm nhạc của những nhạc sĩ thực thụ. OpenAI giải thích rằng:
“Để đào tạo mô hình này, chúng tôi đã thu thập thông tin trên web để sắp xếp một bộ dữ liệu mới gồm 1,2 triệu bài hát (600.000 bài hát trong số đó bằng tiếng Anh), ghép nối với lời bài hát và siêu dữ liệu tương ứng từ LyricWiki.”
Thu thập dữ liệu là một phương pháp được một số công ty AI sử dụng để tạo một tập hợp dữ liệu mà mô hình AI có thể sử dụng để học hỏi và đưa ra quyết định khi tạo hình ảnh, văn bản—hoặc trong trường hợp này là—âm nhạc. Các bộ dữ liệu được tạo bằng cách thu thập thông tin đang gây tranh cãi vì không nhận được sự đồng ý từ chủ sở hữu dữ liệu ngay từ đầu. Mặc dù vậy, một số nền tảng cho phép bạn loại bỏ nội dung của mình khỏi bộ dữ liệu.
Bạn có thể nghĩ rằng 1,2 triệu bài hát là rất nhiều, nhưng để so sánh, Dall-E 2 đã được đào tạo trên hàng trăm triệu cặp hình ảnh-văn bản từ internet. Với ý nghĩ đó, Jukebox có giới hạn của nó.
Nhóm đào tạo tương đối nhỏ của nó không thể nắm bắt được sự phong phú và đa dạng của âm nhạc nhân loại. OpenAI đã tuyên bố rằng nó chủ yếu được đào tạo về âm nhạc phương Tây, thể hiện sự thiên vị rõ ràng về loại nhạc mà nó có khả năng tạo ra.
Bạn có thể làm gì với Jukebox?
Vì vậy, với những hạn chế của nó, bạn có thể làm gì với Jukebox? Một cách nhanh chóng để trả lời câu hỏi đó là nói những gì bạn không thể làm với Jukebox.
Bởi vì phải mất gần nửa ngày để hiển thị một phút nhạc nên nó không hữu ích lắm cho việc sản xuất nhạc. Ít nhất, không phải theo nghĩa truyền thống. Thông thường, các nhạc sĩ di chuyển qua lại giữa việc chơi xung quanh một nhạc cụ (ngẫu hứng) và lên kế hoạch cho cấu trúc của một bài hát. Kiểu thử nghiệm tương tự không thể thực hiện được với Jukebox.
Vì không dễ để tạo một bài hát bằng Jukebox ở giai đoạn này, nên bạn có thể nghĩ về nó nhiều hơn như một cách mới lạ để tạo các mẫu nhạc. Khi bạn đã tạo âm thanh mà mình thích, bạn có thể sử dụng âm thanh đó trong các dự án sáng tạo của mình như bình thường.
Video dưới đây là kết quả của việc ai đó sử dụng nhạc được tạo bằng Jukebox để nhấn mạnh một đoạn phim dựng phim ngắn.
Trí tuệ nhân tạo cũng có nhiều ứng dụng ngoài các ứng dụng sáng tạo, đó là lý do tại sao cần hiểu AI là gì và những mối nguy hiểm mà nó gây ra.
Bạn có bị lay động bởi âm nhạc AI không?
Âm nhạc do Jukebox tạo ra không dễ bị loại bỏ và với tất cả sự kỳ lạ và kỳ lạ, chất lượng máy móc của con người, cuối cùng, âm thanh của nó giống như âm nhạc. Mặc dù ngành công nghiệp âm nhạc đã sử dụng các công cụ AI được một thời gian, nhưng khả năng tạo nhạc dưới dạng âm thanh thô giờ đây mới trở thành hiện thực.
Nhưng trong khi các mô hình như Jukebox tồn tại, chúng vẫn chưa được đóng gói thành một công cụ thương mại và vẫn còn thiếu khả năng của các nhạc sĩ con người.