MỚI NHẤT
CƠ QUAN CỦA TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
PhởGPT sẽ đặt nền móng cho sự phát triển của AI Việt Nam trong tương lai. Ảnh: Lê Ân

PhởGPT ra đời, có nhiều ưu điểm so với ChatGPT

NGUYỄN ĐĂNG LDO | 06/12/2023 13:14

PhởGPT do VinAI phát triển được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt, dùng mở nguồn mở nên tất cả mọi người đều có thể sử dụng.

PhởGPT mang đến lợi ích gì?

Mô hình ngôn ngữ lớn PhởGPT được VinAI giới thiệu trong Ngày hội trí tuệ nhân tạo – AI Day 2023, diễn ra tại TPHCM trong 2 ngày 5 và 6.12. Xuất phát từ nhận thức về những hạn chế của các mô hình tiếng Việt đã có. Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây khó khăn trong việc ứng dụng cho các mục đích thực tế.

Bên cạnh đó việc thiếu một bộ mã nguồn mở, như một nền tảng cho mô hình ngôn ngữ tiếng Việt của người Việt, do người Việt làm chủ, làm giảm khả năng sáng tạo, cũng như những nghi ngại về tính bảo mật khi phải sử dụng phần mềm của nhà cung cấp.

Những điều này không chỉ đặt ra thách thức đối với việc tạo ra các ứng dụng tiếng Việt chất lượng cao mà còn ảnh hưởng đến sự phát triển của cộng đồng ngôn ngữ tự nhiên trong nước. Vì vậy, một trong những nhiệm vụ cấp bách đặt ra đối với cộng động AI nói chung, cộng đồng ngôn ngữ tự nhiên (NLP) nói riêng là xây dựng một mô hình mới, mạnh mẽ hơn và có khả năng xử lý ngôn ngữ Việt với độ chính xác và hiệu suất cao.

PhởGPT ra đời, phần nào giải quyết được nhiệm vụ trên. PhởGPT có thể được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt.

Trên hết, PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Sự khác biệt giữa PhởGPT và ChatGPT

Với mô hình ngôn ngữ dữ liệu lớn có 7.5 tỉ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng -Flash Attention -, ngoại suy độ dài ngữ cảnh AliBi).

Những kĩ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.

Bên cạnh ưu điểm là mô hình ngôn ngữ chuyên dụng cho tiếng Việt, sự khác biệt rất lớn của PhởGPT so với ChatGPT nằm ở việc PhởGPT là một dự án mã nguồn mở (Open-source), thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI.

Sam Atman - cha đẻ của ChatGPT chia sẻ với các đại biểu dự AI Day 2023 về sự ra đời của PhởGPT. Ảnh: Lê Ân

So sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy: PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá. Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.

Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.

Sự ra đời của PhởGPT sẽ đặt nền móng cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiêụ quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.

Trong thời gian tới, VinAI sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như y tế, giáo dục…

Tin mới nhất

Gợi ý dành cho bạn