MỚI NHẤT
CƠ QUAN CỦA TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
Meta đang tập trung nghiên cứu phát triển một mô hình AI mới kết hợp sáu loại dữ liệu khác nhau. Ảnh: AFP

Mô hình AI đa nguồn mở của Meta kết hợp sáu loại dữ liệu khác nhau

Anh Vũ LDO | 10/05/2023 20:00

Mô hình ImageBind mới của Meta kết hợp dữ liệu văn bản, âm thanh, hình ảnh, chuyển động, nhiệt và độ sâu. Đây chỉ là một dự án nghiên cứu nhưng cho thấy, các mô hình trí tuệ nhân tạo trong tương lai có thể tạo ra nội dung đa giác quan như thế nào, theo The Verge.

Meta đã công bố một mô hình trí tuệ nhân tạo (AI) mã nguồn mở mới liên kết nhiều luồng dữ liệu với nhau bao gồm văn bản, âm thanh, dữ liệu hình ảnh, nhiệt độ và chỉ số chuyển động.

Mô hình này vẫn chỉ là một dự án nghiên cứu vào thời điểm hiện tại, chưa có ứng dụng thực tế. Tuy nhiên, nó chỉ ra một tương lai của các hệ thống AI tổng quát, khi chúng có thể tạo ra trải nghiệm nhập vai, đa giác quan.

Cùng với đó, nó thể hiện việc Meta tiếp tục chia sẻ nghiên cứu về AI vào thời điểm mà các đối thủ cạnh tranh như OpenAI và Google ngày càng trở nên bí mật.

Khái niệm cốt lõi của nghiên cứu là liên kết nhiều loại dữ liệu lại với nhau thành một chỉ mục đa chiều duy nhất. Ý tưởng này có vẻ hơi trừu tượng, nhưng chính khái niệm này đã tạo nền tảng cho sự bùng nổ gần đây của các loại AI tổng quát.

Ví dụ, các trình tạo hình ảnh AI như DALL-E, Stable Diffusion và Midjourney đều dựa vào các hệ thống liên kết văn bản và hình ảnh với nhau trong giai đoạn đào tạo. Họ tìm kiếm các mẫu trong dữ liệu hình ảnh khi kết nối thông tin đó với các mô tả về hình ảnh. Đó là những thứ cho phép các hệ thống này tạo ra hình ảnh theo gợi ý văn bản của người dùng. Điều này cũng đúng với nhiều công cụ AI tạo video hoặc âm thanh.

Meta nói rằng, mô hình của họ - ImageBind - là mô hình đầu tiên kết hợp sáu loại dữ liệu vào một không gian nhúng duy nhất. Sáu loại dữ liệu có trong mô hình là: trực quan (ở dạng cả hình ảnh và video), nhiệt (hình ảnh hồng ngoại), chữ, âm thanh, thông tin chuyên sâu và chỉ số chuyển động được tạo ra bởi một đơn vị đo lường quán tính (IMU).

IMU được tìm thấy trong điện thoại và đồng hồ thông minh, nơi chúng được sử dụng cho nhiều tác vụ như chuyển màn hình ngang sang dọc để phân biệt giữa các loại hoạt động vật lý khác nhau.

Nghiên cứu của Meta cho thấy, những tiềm năng mà trí tuệ nhân tạo có thể làm được trong tương lai. Ảnh: AFP 

Ý tưởng là các hệ thống AI trong tương lai sẽ có thể tham chiếu chéo dữ liệu này giống như cách mà các hệ thống AI hiện tại thực hiện đối với các kiểu nhập văn bản.

Ví dụ, hãy tưởng tượng một thiết bị thực tế ảo tương lai không chỉ tạo đầu vào âm thanh và hình ảnh mà còn cả môi trường, chuyển động của người dùng. Họ có thể yêu cầu mô phỏng một chuyến đi biển dài, nó sẽ đưa ra tiếng sóng vỗ phía sau, tiếng đung đưa của boong tàu dưới chân và làn gió mát của không khí đại dương.

Trong một bài đăng trên blog, Meta lưu ý rằng, luồng đầu vào cảm giác khác có thể được thêm vào các mô hình AI trong tương lai, bao gồm “tín hiệu fMRI cảm ứng, lời nói, khứu giác và não”.

Công ty cũng tuyên bố, nghiên cứu “đưa máy móc tiến một bước gần hơn đến khả năng học hỏi của con người một cách đồng thời, toàn diện và trực tiếp từ nhiều dạng thông tin khác nhau”. 

Tất nhiên, đây hoàn toàn là suy đoán và có khả năng là các ứng dụng sắp tới của nghiên cứu như thế này sẽ bị hạn chế hơn nhiều. Tuy nhiên, đối với những người theo dõi ngành, nghiên cứu này cũng rất thú vị vì Meta đang cung cấp mã nguồn mở cho mô hình cơ bản - một hoạt động ngày càng được xem xét kỹ lưỡng trong thế giới AI.

Những người phản đối mã nguồn mở, như OpenAI, cho rằng phương pháp này có hại cho người sáng tạo vì các đối thủ có thể sao chép tác phẩm của họ và điều đó có thể gây nguy hiểm tiềm ẩn, cho phép những kẻ xấu lợi dụng các mô hình AI tiên tiến nhất.

Những người ủng hộ trả lời rằng, nguồn mở cho phép các bên thứ ba xem xét kỹ lưỡng các hệ thống để tìm lỗi và cải thiện một số lỗi của chúng.

Họ lưu ý, nó thậm chí có thể mang lại lợi ích thương mại, vì về cơ bản, nó cho phép các công ty tuyển dụng các nhà phát triển bên thứ ba làm công nhân không được trả lương để cải thiện công việc của họ.

Tin mới nhất

Gợi ý dành cho bạn