MỚI NHẤT
CƠ QUAN CỦA TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
Việc chỉnh sửa hình ảnh sẽ trở nên dễ dàng hơn chỉ với các thao tác kéo thả. Ảnh: DragGAN

Tương lai của các AI chỉnh sửa hình ảnh

Anh Vũ LDO | 21/05/2023 10:29

Trí tuệ nhân tạo (AI) đang được nghiên cứu này là một công cụ cho phép người dùng chỉnh sửa một hình ảnh đã được tạo sẵn theo thông số kỹ thuật của họ.

Với mô hình trí tuệ nhân tạo (AI) DragGAN, nếu người dùng muốn “thay đổi kích thước của ôtô hoặc biến nụ cười thành cái cau mày chỉ bằng một cú nhấp và kéo đơn giản”, nó sẽ thực hiện cho họ.

Mạng đối thủ sáng tạo (GAN) hiện ở dạng một bài báo nghiên cứu, tuy nhiên, nó đã thu hút được sự chú ý từ những người quan tâm đến nỗi trang chủ của nhóm nghiên cứu đã gặp sự cố do lưu lượng truy cập quá lớn.

The Verge đã so sánh DragGAN với công cụ Warp trong Photoshop, đồng thời nói thêm rằng nó mạnh hơn nhiều vì nó không “làm mờ các pixel xung quanh” mà là “tạo lại đối tượng bên dưới” và thậm chí có thể xoay hình ảnh 3D.

Tiềm năng của một công cụ như vậy nằm ở chỗ AI tổng hợp chuyển văn bản thành hình ảnh không phải lúc nào cũng tạo ra những gì người dùng mong muốn. Vì vậy, họ có thể quay lại sau đó và thực hiện các chỉnh sửa đối với hình ảnh hiện có với một AI khác, thay vì phải tạo một hình ảnh mới.

Một số bản xem thử, là một phần của bài báo nghiên cứu, bao gồm thêm chiều cao cho một ngọn núi, thay đổi vị trí của người mẫu và chỉnh sửa độ dài và hình dạng quần áo của chủ thể, mở hoặc đóng miệng sư tử và thay đổi khuôn mặt của một người từ vẻ ngoài bình thường với một nụ cười.

Với nhiều công cụ AI hiện có, người dùng phải tạo lại một hình ảnh với lời nhắc cụ thể hơn để có được kết quả mong muốn hơn.

Nhóm nghiên cứu đã lưu ý trong bài báo của mình rằng các chi tiết mới có thể được thêm vào trong quá trình tái tạo các khía cạnh đã chỉnh sửa của hình ảnh có lợi cho bản cập nhật. 

“Cách tiếp cận của chúng tôi có thể gây ảo giác cho nội dung bị che khuất, giống như răng bên trong miệng sư tử và có thể biến dạng theo độ cứng của vật thể", nhóm nghiên cứu cho biết.

Có nhiều thương hiệu đang cố gắng cung cấp các tùy chọn chỉnh sửa cho nội dung AI tổng quát. Tuy nhiên, hầu hết không đi xa đến mức cho phép chỉnh sửa hình ảnh thực sự, mà là cho các khía cạnh như chỉnh sửa xung quanh hình ảnh.

Ví dụ: ứng dụng Designer của Microsoft cho phép người dùng tạo hình ảnh AI từ lời nhắc văn bản và họ có thể chọn mục yêu thích của mình từ ba kết quả. Tuy nhiên, người dùng không thể chỉnh sửa hình ảnh do AI tạo ra.

Với công cụ DragGAN, hiện vẫn là bản demo, không thể biết chất lượng của những sản phẩm này sẽ như thế nào hoặc thậm chí liệu nó có khả thi hay không, đặc biệt là khi các bản demo dựa trên video có độ phân giải thấp.

Tuy nhiên, đó là một ví dụ thú vị về việc AI tiếp tục phát triển nhanh như thế nào.

Tin mới nhất

Gợi ý dành cho bạn