AI nào tốt hơn trong việc tạo ra bàn tay?
Trình tạo nghệ thuật AI tiếp tục gây ấn tượng, cho phép chúng tôi tạo ra bất cứ thứ gì chúng tôi có thể tưởng tượng. Tuy nhiên, công nghệ này dường như đã va phải một bức tường gạch khi tạo ra những bàn tay trông giống như thật.
Ở đây, chúng tôi xem xét hai trong số các ứng dụng nghệ thuật sáng tạo hàng đầu và so sánh chúng trực tiếp—hoặc trực tiếp—để xem ứng dụng nào có thể tạo ra những bàn tay tốt hơn, Midjourney v5 hoặc Dall-E 2. Có một trong hai ứng dụng này thành thạo tay? Hãy cùng tìm hiểu!
Mục Lục
Vấn đề của AI với bàn tay
Kể từ khi các tác phẩm nghệ thuật do AI tạo ra trở nên phổ biến trên internet, đã có nhiều lời chỉ trích về chất lượng của các bức vẽ tay do AI vẽ. Mặc dù có các bản cập nhật gần đây, như thể hiện trong các so sánh song song của chúng tôi, nhưng kết quả vẫn chưa khả quan.
Cả hai ứng cử viên đều đang cải thiện khả năng và chất lượng đầu ra của họ qua mỗi lần lặp lại. Bản cập nhật mới nhất, Phiên bản 5 của Midjourney, đã cho thấy sự tiến bộ ấn tượng. Tuy nhiên, vấn đề với bàn tay do AI vẽ vẫn chưa được giải quyết và không thể bỏ qua.
So sánh 1: Sử dụng Lời nhắc “Tay” và “Tay”
Các so sánh của chúng tôi sẽ chứa các lời nhắc giống hệt nhau cho cả Dall-E 2 và Midjourney v5. Chúng tôi sẽ thiết kế các lời nhắc cụ thể cho từng bàn tay thay vì chỉ tạo ra những người để xem các bàn tay trông như thế nào. Chúng tôi cũng chỉ cho mỗi ứng dụng một cơ hội (cuộn) cho mỗi lời nhắc.
Tay
Hãy bắt đầu mọi thứ với lời nhắc cơ bản và phù hợp nhất: “tay”.
Giữa hành trình v5:
Dall-E 2:
Chúng tôi không có một khởi đầu tốt!
Midjourney đã đi theo con đường khác thường là liên kết một bàn tay với những tình huống khá sáng tạo. Thay vì chỉ tập trung vào một bàn tay, chúng ta thấy một phù thủy, găng tay, bộ xương và một bức tượng nhỏ. Hình ảnh găng tay bị thiếu một ngón tay quá.
Dall-E 2 có cách tiếp cận ngược lại và chỉ cung cấp cho chúng ta một bàn tay duy nhất trên nền đơn giản. Nhưng kỳ lạ thay, có một số tư thế kỳ lạ, đặc biệt là với ngón tay cái, trông không được tự nhiên hoặc thoải mái. Mỗi bàn tay cũng bị cắt ở một trong các mặt của hình ảnh.
Ai thắng vòng này? Chúng tôi sẽ đưa nó cho Dall-E 2 để có độ chính xác tổng thể.
tay
Bây giờ, hãy đặt dấu nhắc ở dạng số nhiều, “tay” và xem AI nghĩ ra gì.
Giữa hành trình v5:
Dall-E 2:
Lần này, nỗ lực của Midjourney đối với “tay” hóa ra tốt hơn. Nhưng cả bốn hình đều đen trắng, và chúng tôi thiếu một số ngón tay. Khi kiểm tra kỹ hơn, bạn cũng có thể thấy rằng một số chữ số có hình dạng kỳ lạ hoặc biến thành một số khác.
Dall-E 2 tiếp tục có các bàn tay với nền đơn giản. Không có chữ số nào bị thiếu, nhưng các kim bị cắt trong hình ảnh thứ ba và các phiên bản khác có vẻ hơi vụng về trong bố cục và hoàn toàn thiếu tính sáng tạo.
Hãy gọi sự so sánh này là một trận hòa. Dall-E 2 sẽ giành chiến thắng về độ chính xác nếu đó là yếu tố duy nhất, nhưng Midjourney quản lý để tạo ra một số hình ảnh đẹp trong các phiên bản đen trắng của nó, ngay cả khi cả bốn phiên bản đều không thực tế lắm.
Bạn luôn có thể sử dụng Photoshop để chỉnh sửa tác phẩm nghệ thuật Midjouney của mình, bao gồm cả bàn tay.
So sánh 2: Cử chỉ tay
Hãy so sánh một vài cử chỉ tay gần như được mọi người công nhận.
Bắt chéo ngón tay
Đầu tiên, hãy thử “ngón tay bắt chéo”.
Giữa hành trình v5:
Dall-E 2:
Có thể nói rằng Midjourney đã hoàn toàn làm hỏng lời nhắc này. Chúng tôi đang thiếu ngón tay và không có phiên bản nào trông tự nhiên cả.
Một lần nữa ngả mũ trước Dall-E 2 vì đã đếm chính xác ngón tay, nhưng đó là tin tốt duy nhất. Mỗi phiên bản trông giống như các ngón tay đang thực hiện các tư thế yoga của riêng chúng trong trò chơi Twister.
Không có người chiến thắng trong so sánh này.
Thumbs Up
Tiếp theo, chúng ta sẽ sử dụng “thumbs up”.
Giữa hành trình v5:
Dall-E 2:
Midjourney đếm ngón tay chính xác trong khi xử lý từng lời nhắc theo cách sáng tạo. Chú ý phần giới thiệu của một phong cách minh họa?
Dall-E 2 cũng nhận được điểm về độ chính xác khi không cố gắng làm rung chuyển con thuyền bằng bất kỳ thứ gì sáng tạo được thêm vào mỗi kết quả.
Không có người chiến thắng rõ ràng ở đây.
So sánh 3: Bàn tay với đồ vật
Bây giờ, chúng ta sẽ nâng cao độ phức tạp bằng cách nhắc bàn tay tương tác với các đồ vật.
Tay Cầm Quả Cầu Pha Lê
Hãy bắt đầu với một đối tượng ngẫu nhiên, sử dụng lời nhắc “tay cầm quả cầu pha lê”.
Giữa hành trình v5:
Dall-E 2:
Khi chúng tôi tăng độ phức tạp, Midjourney bắt đầu tỏa sáng. Ngoại trừ một vài biểu hiện trông không tự nhiên, các kim và quả cầu pha lê trông rất đẹp. Midjourney thậm chí còn dành thời gian để tạo ra hình ảnh phản chiếu trong kính chắc chắn sẽ làm tăng thêm tính sáng tạo tổng thể.
Nhưng lần đầu tiên, chúng ta thấy Dall-E 2 thiếu một chữ số ở ít nhất một trong các kim, với kim thứ tư trông thật kỳ lạ. Những quả cầu pha lê trông cũng không ấn tượng bằng của Midjourney.
Midjourney có được chiến thắng đầu tiên.
Tay Cầm Nước
Hãy thử một cái gì đó phức tạp hơn với lời nhắc “tay cầm nước”.
Giữa hành trình v5:
Dall-E 2:
Midjourney chỉ quản lý để cuộn một hình ảnh với số chữ số chính xác. Mặc dù được kết xuất đẹp mắt, nhưng một lần nữa chúng ta bắt đầu thấy những vết nứt trong bộ phận đáng tin cậy.
Dall-E 2 cũng phải vật lộn để đạt được bàn tay tự nhiên nhưng làm tốt hơn nhiều. Nó cũng chuyển màu trong nền cho một số loại.
Chúng ta sẽ giao vòng này cho Dall-E 2.
So sánh 4: Bàn tay làm việc
Để so sánh này, chúng tôi sẽ tạo lời nhắc có bàn tay tham gia vào các hoạt động.
Tay Nặn Đất Sét
Cùng xem các mô hình AI xử lý như thế nào với “bàn tay nặn đất sét” nhé.
Giữa hành trình v5:
Dall-E 2:
Midjourney bỏ lỡ một ngón tay trong hai hình ảnh nhưng mọi thứ khác đều tuyệt vời.
Hình ảnh của Dall-E 2 trông khó hiểu và đông đúc, phải thêm bàn tay của người khác vào một nửa số phiên bản.
Các cạnh chuyển sang Midjourney.
Tay Ép Bột
Hãy thử một hoạt động tương tự, “bàn tay nặn bột”.
Giữa hành trình v5:
Dall-E 2:
Hình ảnh của Midjourney nhìn tổng thể rất tuyệt. Nhưng một lần nữa, một nửa trong số chúng bị thiếu chữ số. Nhưng những hình ảnh không thể bị lỗi vì phong cách nghệ thuật của họ.
Các phiên bản của Dall-E 2 cũng thiếu ngón tay trong một nửa số phiên bản và thậm chí thêm một ngón tay vào bàn tay cuối cùng trong bộ.
Hãy gọi đây là một trận hòa.
Nếu bạn muốn tự mình thử những phép so sánh này, chúng tôi sẽ chỉ cho bạn cách sử dụng Midjourney để tạo tác phẩm nghệ thuật AI.
Kết quả cho chúng ta biết điều gì?
Thật thú vị khi so sánh và xác định người chiến thắng chung cuộc. Và nếu chúng tôi phải chọn, chúng tôi sẽ ủng hộ Midjourney v5. Mặc dù Dall-E 2 tạo ra các bàn tay có số lượng ngón tay chính xác thường xuyên hơn, nhưng chính Midjourney đã tạo ra những hình ảnh hấp dẫn và nghệ thuật hơn.
Nhưng cả hai ứng dụng đều có chỗ đứng trên thị trường dành cho các nghệ sĩ sử dụng lại hình ảnh Dall-E 2 và Midjourney cho tác phẩm của họ. Cả hai đều có khả năng tạo ra những bàn tay có thể được sử dụng làm đồ cắt bỏ hoặc vật liệu tổng hợp cho mục đích nghệ thuật, biên tập và thương mại. Đó chỉ là vấn đề sở thích cá nhân.
AI cuối cùng sẽ chinh phục tay
Các ứng dụng nghệ thuật sáng tạo như Dall-E 2 và Midjourney đã tiến một bước dài về khả năng tạo ra tác phẩm nghệ thuật chân thực và tuyệt vời. Họ vẫn phải vật lộn với những bàn tay tạo ra, nhưng với sự tăng tốc của công nghệ tạo ra, chúng ta chỉ có thể mong đợi sự cải thiện trong tương lai gần.