MỚI NHẤT
CƠ QUAN CỦA TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM

Google phát triển AI tự tạo game 2D chỉ bằng hình ảnh hoặc văn bản

Nhóm PV LDO | 29/02/2024 20:21

Mới đây Google đã công bố tài liệu nghiên cứu về mô hình AI có tên Genie - có khả năng tạo ra các trò chơi điện tử 2D từ lời nhắc văn bản và một hình ảnh duy nhất.

Thế giới đang chứng kiến cuộc chạy đua phát triển trí tuệ nhân tạo AI trên mọi lĩnh vực của các gã khổng lồ công nghệ trên thế giới. Bên cạnh các sản phẩm AI thú vị của OpenAI, Microsoft..., Google mới đây đã công bố tài liệu nghiên cứu về mô hình AI có tên Genie - có khả năng tạo ra các trò chơi điện tử 2D từ lời nhắc văn bản và một hình ảnh duy nhất.

Genie được dự báo sẽ tạo nên một cơn sốt giống như mô hình AI mới có tên Sora, giúp tạo ra các đoạn video ngắn từ văn bản mà OpenAI mới giới thiệu đến người dùng.

Sự kiện giới thiệu Genie của Google. Ảnh: DeepMind

Theo thông tin được Google cung cấp, Genie được phát triển bởi nhóm Open-Endedness thuộc Công ty Google DeepMind, dự án nghiên cứu này hứa hẹn là tương lai của ngành giải trí, phát triển trò chơi và thậm chí cả lĩnh vực robot.

Google cho biết Genie được huấn luyện trên bộ dữ liệu khổng lồ gồm 200.000 giờ video chưa được gắn nhãn, chủ yếu là các trò chơi nền tảng 2D xuất hiện trên Internet.

Để tạo ra được các trò chơi 2D trên Internet, Genie sẽ học hỏi bằng cách quan sát các hành động và tương tác trong các video này, cho phép nó tạo ra trò chơi 2D từ một mô tả đơn giản bằng văn bản hoặc hình ảnh.

Những trò chơi đơn giản đầu tiên được Genie tạo ra. Ảnh: DeepMind

Theo tài liệu nghiên cứu về Genie được Google DeepMind công bố, Genie hoạt động theo 3 bước chính như sau:

- Token hóa Video (Video Tokenizer): Xử lý khối dữ liệu video khổng lồ thành các đơn vị nhỏ gọn được gọi là "token". Các token này đóng vai trò như những khối xây dựng cơ bản giúp Genie hiểu thế giới hình ảnh.

- Mô hình Hành động Latent (Latent Action Model): Ở bước này, Genie sẽ phân tích sự chuyển đổi giữa các khung hình liên tiếp trong video. Quá trình phân tích này cho phép nó xác định các hành động cơ bản bao gồm: nhảy, chạy, tương tác với các vật thể trong môi trường trò chơi.

Cơ chế phân tích và tạo ra hình ảnh và lối chơi trong Game của Genie. Ảnh: DeepMind

- Mô hình Động lực học (Dynamics Model): Cuối cùng là quá trình kết hợp mọi thứ lại với nhau.

Hiện tại, Genie vẫn đang trong quá trình phát triển nên vẫn còn nhiều giới hạn như chất lượng hiển thị vẫn rất kém khi tốc độ khung hình mới chỉ ở mức 1FPS, ảnh hưởng đến độ trung thực hình ảnh. Sau khi hoàn thiện sản phẩm, Genie sẽ được Google giới thiệu rộng rãi đến người dùng.

Tin mới nhất

Gợi ý dành cho bạn