Cái nào tốt hơn trong việc mở rộng hình ảnh?
Một trong những tính năng hữu ích nhất của các trình tạo hình ảnh AI hàng đầu là khả năng mở rộng hình ảnh sang kích thước và tỷ lệ khác. Các quảng cáo không còn bị “mắc kẹt” với những hình ảnh mà họ có; bạn có thể tạo hình ảnh mới tùy chỉnh từ bản gốc. Ngay cả từ một con mắt, trí tuệ nhân tạo có thể điền vào toàn bộ con người nếu chúng ta chọn.
Trong bài viết này, chúng ta sẽ so sánh khả năng của tính năng Vẽ ngoài của DALL-E và Generative Fill của Photoshop để xem ứng dụng nào có thể mở rộng hình ảnh tốt hơn.
Mục Lục
Cách truy cập Generative Fill và Outpainting
Bạn có thể truy cập tính năng Phác thảo của DALL-E từ trang web của DALL-E. Chỉ cần chọn Thử vẽ ngoài từ menu ở góc trên bên phải. Xem hướng dẫn đầy đủ của chúng tôi về cách sử dụng Outpainting trong DALL-E 2.
Để truy cập vào Generative Fill của Photoshop, bạn phải là người đăng ký Adobe. Bạn có thể đăng ký bản Beta trên trang web của Adobe Firefly hoặc sử dụng Photoshop Beta. Xem hướng dẫn đầy đủ của chúng tôi về cách sử dụng công cụ Generative Fill trong Photoshop.
Hãy nhảy vào so sánh!
1. Mở rộng hình ảnh của một con mắt
Hãy bắt đầu so sánh giữa Generative Fill của Photoshop và Outpainting của DALL-E với ví dụ điển hình nhất; mở rộng khung hình từ cận cảnh một con mắt. Chúng tôi bắt đầu với một phần mắt có độ phân giải 1.024 x 1.024 pixel và mở rộng vùng cắt để bao gồm tám hộp có cùng kích thước xung quanh nó.
Hóa ra cả Photoshop và DALL-E đều không thể mở rộng mắt trung tâm thành một bức ảnh hoàn chỉnh. Thay vào đó, họ chỉ có thể tái tạo tám mắt riêng lẻ được mở rộng từ mắt ban đầu.
vẽ ngoài:
Điền sáng tạo:
Công bằng mà nói, ví dụ này chỉ minh họa cho công nghệ hiện tại. Cả hai ứng dụng đều không thể kiểm tra toàn bộ khung hình theo cách này và tạo ra sự mở rộng nhất quán của mắt.
Nhưng nếu được thiết lập theo cách khác, điều không thể thực hiện được trong Outpainting hiện tại, Generative Fill của Photoshop có thể mở rộng toàn bộ mắt nếu chỉ có một lựa chọn được thực hiện từ xung quanh mắt. Sử dụng công cụ Rectangular Marquee Tool, chúng ta tạo một vùng chọn trong khung hình của con mắt và sau đó đảo ngược vùng chọn.
Lựa chọn Điền sáng tạo:
Sau đó, chúng tôi chỉ cần nhập “mắt phụ nữ” làm lời nhắc và tạo một phần mở rộng nhất quán.
Phần mở rộng đầy đủ của Generative Fill:
Hạn chế duy nhất hiện tại của phương pháp này là toàn bộ phần mở rộng xung quanh mắt ban đầu có độ phân giải tối đa là 1.024 pixel ở cạnh dài nhất. Điều này tạo ra hiệu ứng mờ hoặc hơi mất nét. Và nếu phóng to, bạn sẽ thấy thiếu độ phân giải so với phiên bản gốc 1.024 pixel.
2. Mở rộng ảnh phong cảnh
Đối với phép so sánh thứ hai, chúng tôi sẽ lấy một hình ảnh vuông 1.024 pixel và mở rộng nó ra gần gấp đôi kích thước của nó dưới dạng phiên bản nằm ngang phù hợp hơn cho ảnh phong cảnh. Chúng tôi đã tận dụng điểm mạnh của cả hai ứng dụng để tạo ra kết quả tốt nhất.
vẽ ngoài:
Chúng tôi đã mở rộng khung hình tạo ra một vài lần, đảm bảo có sự chồng chéo tốt để DALL-E có thể sử dụng các pixel. “Phong cảnh” đã được nhập làm lời nhắc. Được sử dụng theo cách này, Outpainting thực hiện công việc tuyệt vời.
Điền sáng tạo:
Trong Photoshop, chúng tôi chỉ chồng lên một khung bổ sung và tạo ra một khung mở rộng liền mạch. Generative Fill rất có khả năng tạo ra những hình ảnh phong cảnh như vậy.
3. Mở rộng hình ảnh của một người
Mọi người luôn có một chút khó khăn để kéo dài, cả quần áo và tay chân của họ. Tại thời điểm viết bài này, bạn có thể thay quần áo bằng Generative Fill nếu kết quả là bạn không bận tâm đến các loại quần áo khác nhau. Về cơ bản, đừng mong đợi chỉ thay đổi màu sắc trong tủ quần áo của bạn. Và hiện tại, tất cả các trình tạo hình ảnh AI đều có vấn đề với tay.
Nhưng hãy thử nghiệm Generative Fill và Outpainting. Bạn có thể mở rộng hình ảnh của một người bị cắt ở ngực và kết thúc bằng thứ gì đó có thể sử dụng được không? Hãy cùng tìm hiểu. Một lần nữa, chúng tôi đã sử dụng hình ảnh vuông 1.024 pixel và chúng tôi đang tìm cách mở rộng hình ảnh về phía chân của người đàn ông.
vẽ ngoài:
DALL-E’s Outpainting đã thực hiện khá tốt công việc điền vào các chi tiết. Không phải lúc nào người ta cũng nắm bắt được thực tế là người đàn ông giơ một tay lên và đôi khi cho cả hai tay vào túi. Nhưng đó là lý do tại sao có bốn phiên bản để lựa chọn và tùy chọn tạo thêm (với chi phí tín dụng).
Điền sáng tạo:
Generative Fill cũng đã thực hiện khá tốt việc điền thông tin chi tiết. Nó trông không hoàn hảo, có lẽ chỉ ở mức khá. Nhưng trái ngược với DALL-E’s Outpainting, bạn có thể tiếp tục tạo các phiên bản mới và sau đó thực hiện các chỉnh sửa nhỏ mà không tốn thêm bất kỳ khoản tín dụng nào.
Cái nào là tốt nhất, sáng tạo hay vẽ ngoài?
Từ các ví dụ ở đây và thử nghiệm thêm, Generative Fill và Outpainting có vẻ giống nhau về cách chúng mở rộng các loại hình ảnh khác nhau. Mỗi người đều có những hạn chế của mình, nhưng chất lượng của các thế hệ dường như quá gần để gọi. Không ai nổi bật là người chiến thắng rõ ràng trong mọi so sánh mà chúng tôi thực hiện chỉ dựa trên một vài nỗ lực để mở rộng hình ảnh.
Tuy nhiên, Generative Fill của Photoshop có một vài lợi thế lớn so với Outpainting của DALL-E, đặc biệt nếu bạn đã là người dùng Photoshop có đăng ký Adobe.
- Bạn có thể tạo các thế hệ không giới hạn (hiện tại) và không cần phải trả thêm tín dụng.
- Generative Fill linh hoạt hơn vì bạn có thể sử dụng các công cụ lựa chọn của Photoshop để tạo các thế hệ nhanh hơn và chính xác hơn.
- Bạn cũng có quyền truy cập vào Photoshop với tư cách là một trong những trình chỉnh sửa ảnh hàng đầu trong ngành để thực hiện các điều chỉnh chỉnh sửa và sáng tạo hơn nữa.
Xin ngả mũ trước Photoshop và DALL-E cho những hành trình tương ứng của chúng cho đến nay. Cả hai ứng dụng đều có thể thực hiện công việc mở rộng hình ảnh khá tốt.
Người dùng được hưởng lợi từ sự cạnh tranh
Người dùng Generative Fill và Outpainting sẽ được hưởng lợi từ sự cạnh tranh giữa các công ty như Adobe và OpenAI đang làm việc suốt ngày đêm để cải thiện hệ thống AI của họ. Khi chất lượng tạo hình ảnh được cải thiện, các tính năng và công cụ hỗ trợ chúng tôi tùy chỉnh hình ảnh của mình cũng vậy. Bạn thích ứng dụng nào nhất để mở rộng hình ảnh?