Meta xây dựng các mô hình AI cung cấp âm thanh chân thật cho VR

Khánh Ly LDO | 28/06/2022 15:55

Meta đã xây dựng ba mô hình trí tuệ nhân tạo (AI) mới để làm cho âm thanh nghe thật hơn trong trải nghiệm thực tế ảo.

Các nhà nghiên cứu AI và các chuyên gia âm thanh từ nhóm Reality Labs của Meta cho biết: “Âm học đóng một vai trò quan trọng trong việc trải nghiệm âm thanh trong metaverse và chúng tôi tin rằng AI sẽ là cốt lõi để mang lại chất lượng âm thanh một cách chân thật nhất”.

“Nhận thức đúng âm thanh trong không gian là chìa khóa để mang lại cảm giác thực tế trong metaverse, nếu bạn đang ở một buổi hòa nhạc hoặc chỉ nói chuyện với bạn bè xung quanh, thì có âm thanh sẽ khiến bạn cảm thấy như mình đang thực sự ở đó” - Zuckerberg (nhà sáng lập Facebook) viết trên blog.

Hiển nhiên, buổi hòa nhạc đó sẽ nghe rất khác nếu được biểu diễn trong một phòng hòa nhạc quy mô lớn hơn là trong một khán phòng của trường trung học cơ sở do sự khác biệt giữa không gian vật lý và âm thanh của chúng.

Do đó, phòng thí nghiệm thực tế và AI của Meta (MAIR, trước đây là FAIR) đang hợp tác với các nhà nghiên cứu từ UT Austin để phát triển bộ ba AI hiểu được âm thanh mã nguồn mở, giúp các nhà phát triển xây dựng trải nghiệm AR và VR nhập vai hơn với âm thanh sống động như thật.

Đầu tiên là mô hình đối sánh âm thanh trực quan của MAIR, có thể điều chỉnh clip âm thanh mẫu cho bất kỳ môi trường nhất định nào chỉ bằng cách sử dụng hình ảnh của không gian.

Mô hình này được gọi là AViTAR, có chức năng “học đối sánh âm thanh từ các video trên web, dù chúng có thiếu hay không khớp về âm thanh và dữ liệu chưa được gắn nhãn”.

Ngoài ra, chế độ không âm vang (VIDA) của MAIR sẽ loại bỏ hiệu ứng dội âm khi chơi một nhạc cụ trong một không gian rộng.

Cụ thể, nó sẽ “học cách loại bỏ tiếng vang dựa trên cả âm thanh quan sát được và luồng hình ảnh”. Công nghệ này có thể được sử dụng để tách giọng nói và khẩu lệnh một cách hiệu quả hơn, giúp cả con người và máy móc đều hiểu được âm thanh dễ dàng hơn.

Mô hình thứ ba mang tên Visual Voice, hoạt động tương tự như VIDA nhưng đối với giọng nói.

Nó sử dụng cả tín hiệu hình ảnh và âm thanh để học cách tách giọng nói khỏi tiếng ồn xung quanh trong các buổi đào tạo tự giám sát của nó. Meta dự đoán mô hình này sẽ phải làm nhiều việc trong các ứng dụng hiểu máy và cải thiện khả năng tiếp cận.

Mark Zuckerberg bày tỏ: “Chúng tôi hình dung ra một tương lai nơi mọi người có thể đeo kính AR và tưởng tượng không gian ba chiều từ đồ họa và âm thanh khi họ chơi trò chơi trong một thế giới ảo”.

Tuy nhiên, AViTAR và VIDA chỉ có thể áp dụng các nhiệm vụ của họ cho những hình ảnh mà nó đã được lập trình trước, và sẽ cần cải thiện và phát triển thêm trước khi phát hành ra công chúng. “Những mô hình này đang đến gần hơn với những trải nghiệm đa phương thức, phong phú mà chúng tôi muốn xây dựng trong tương lai”.

Công nghệ

Meta xây dựng các mô hình AI cung cấp âm thanh chân thật cho VR

Tin liên quan

Trí tuệ nhân tạo trong cuộc sống hiện đại: AI tham gia chống tắc đường

Mark Zuckerberg đặt kỳ vọng tiếp cận một tỉ người trong metaverse

Meta bác bỏ cáo buộc của Mỹ về việc vi phạm luật nhà ở liên bang

Bạn có thể quan tâm

Dồn lực cho 5G, tăng tốc chuyển đổi số quốc gia

Cảnh báo nguy cơ tấn công mã hóa dữ liệu

Kinh tế số Việt Nam có thể đạt mục tiêu 20% GDP vào năm 2025

Cách khóa ứng dụng trên iPhone, iPad

Tin mới nhất

Huawei sẵn sàng thúc đẩy tiến bộ công nghệ, kinh tế số tại ASEAN

Samsung dẫn đầu doanh số bán smartphone đầu năm 2024

Microsoft đầu tư thêm 1,7 tỉ USD vào Indonesia

Ukraina dùng iPad để điều khiển vũ khí trên máy bay Nga cũ

Cách khóa ứng dụng trên iPhone, iPad

Dồn lực cho 5G, tăng tốc chuyển đổi số quốc gia

Kinh tế số Việt Nam có thể đạt mục tiêu 20% GDP vào năm 2025

Bảo đảm an toàn thông tin mạng trong dịp nghỉ lễ 30.4, 1.5

Cảnh báo nguy cơ tấn công mã hóa dữ liệu

Trung Quốc cấy chip vào não để điều khiển robot bằng suy nghĩ

Đã có hướng dẫn để chặn tấn công mạng bằng mã độc đòi tiền chuộc

Một mẫu iPhone vừa được giảm giá cực sâu

Cách cài máy in cho MacBook đơn giản

Tiềm năng trí tuệ nhân tạo Việt trong y học chính xác

Cách khóa Facebook mới nhất trên điện thoại

Làm gì khi quên số điện thoại của bản thân?

TPHCM thúc đẩy phát triển kinh tế số ở mảng du lịch, giáo dục, logistics

Đà Nẵng cần xác định mục tiêu, chính sách rõ ràng để phát triển vi mạch

ByteDance không muốn bán TikTok cho công ty Mỹ

Choáng ngợp những dàn âm thanh trị giá 9 chữ số tại triển lãm âm thanh, ánh sáng

Vỡ mộng lớp học viết sách miễn phí bằng công nghệ AI

Elon Musk mở ra cơ hội ngồi nhà mà vẫn kiếm tiền to cho người Mỹ

TPHCM đặt nhiều kỳ vọng vào Trung tâm Cách mạng công nghiệp 4.0

Nâng tính cạnh tranh các sản phẩm, hàng hóa vùng ĐBSCL từ sở hữu trí tuệ

Bất ngờ với dữ liệu mua sắm online của người Việt

Kinh tế số, chìa khóa phát triển mới của Nam Trung bộ - Tây Nguyên

Không có quốc gia nào "hóa rồng", "hóa hổ" mà không có công nghiệp điện tử

Kính thông minh có trí tuệ nhân tạo hoạt động như nào?

Hiểm họa mất thông tin cá nhân khi dùng ứng dụng hẹn hò qua mạng

Trung tâm dữ liệu TPHCM ghi nhận gần 13 triệu vụ tấn công mạng

49 doanh nghiệp cung cấp game trực tuyến bị đình chỉ giấy phép

Người Việt mua hơn 760 triệu đơn hàng online chỉ trong 3 tháng đầu năm

Gần 50 hồ sơ trong ngày đầu đăng ký cấp phiếu lý lịch tư pháp trên VNeID ở Huế

Malaysia sẽ xây dựng trung tâm thiết kế vi mạch tích hợp lớn nhất Đông Nam Á

Sản phẩm làm đẹp thống lĩnh các sàn thương mại điện tử Việt

Samsung, Qualcomm bắt tay để tăng tốc độ mạng 5G

Giả mạo Google Chrome để đánh cắp thông tin và loạt chiêu lừa đảo mới nhất

Huế hướng dẫn cách đăng ký cấp phiếu lý lịch tư pháp trên VNeID

Microsoft tung trí tuệ nhân tạo có thể biến hình ảnh thành video

Elon Musk nhắm tới thị trường xe tự lái Trung Quốc

Việt Nam có hệ sinh thái đổi mới sáng tạo sôi động nhất khu vực

Mỹ có thể cấm TikTok sớm hơn dự định

Apple gỡ ứng dụng của Meta khỏi cửa hàng ứng dụng nội địa Trung Quốc

Nguồn gốc Bitcoin Halving và những tác động đến tiền mã hóa

Nhiều điện thoại Samsung bị lỗi sọc xanh màn hình sau khi cập nhật bản mới

Phát động tuần lễ đổi mới sáng tạo, khởi nghiệp sáng tạo 2024

Cách trí tuệ nhân tạo thân thiện giúp NVIDIA dẫn đầu ngành công nghiệp mới

Triển khai 5G sẽ thúc đẩy phát triển đô thị thông minh tại TPHCM nhanh hơn

Gợi ý dành cho bạn

Đường phố chật như nêm, hạ tầng giao thông Sa Pa quá tải dịp nghỉ lễ

Trở lại Hà Nội sớm, dòng phương tiện vẫn mắc kẹt ở cửa ngõ phía Nam

Tiêu thụ điện phá vỡ mọi kỷ lục: Huy động toàn bộ các nhà máy điện than

Vượt gần 200km cho con đi chơi vườn thú dịp 30.4

Bác bỏ hoang tin "Đà Lạt xảy ra bạo động", sẽ xử lý người lan truyền tin sai

Vạn khách chen chân tham quan tranh panorama Chiến dịch Điện Biên Phủ

1 nhân viên Sở của TPHCM phát hiện lỗi nghiêm trọng ở dự án liên quan AIC

Nắng nóng dữ dội, xảy ra cháy rừng trên diện rộng tại Nghệ An

Đường ra bãi biển Cồn Vành ở Thái Bình kẹt cứng vì lượng khách đông kỷ lục

Tình huống pháp lý vụ bảo vệ khóa bánh xe cứu thương ở chung cư Hà Nội

Muôn kiểu báo lãi, lỗ của các nhà cung cấp bia trong quý I/2024

Cựu chiến binh 64 tuổi đạp xe từ Hà Nội vào TPHCM thăm Dinh Độc Lập

Hướng dẫn viên du lịch kín tour trong 5 ngày nghỉ lễ 30.4-1.5

Trải nghiệm nơi mình sống thay vì đi chơi xa dịp nghỉ lễ

Mùa hoa sứ tỏa hương khoe sắc rực rỡ quanh Bạch Dinh ở Vũng Tàu

Tổng thống cuối cùng của chính quyền Mỹ – Ngụy đầu hàng quân ta là ai?

Báo Lao Động tuyển dụng: Nhân viên quản lý quảng cáo điện tử, tổ chức sự kiện và khai thác quảng cáo làm việc tại Hà Nội

Cây phượng bất ngờ bật gốc, đè trúng xe ôtô đỗ dưới lòng đường ở Hải Phòng

Tin 20h: Thời điểm có Nghị định mới về cải cách tiền lương