Dự án ViGen: Nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI

17:25' - 16/03/2025
BNEWS Dự án ViGen được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển trí tuệ nhân tạo (AI), đồng thời, góp phần thúc đẩy kinh tế số.

Chương trình Thách thức đổi mới sáng tạo - là sự kiện trong chuỗi Hội nghị quốc tế về "Trí tuệ nhân tạo và Bán dẫn - AISC 2025", sự kiện quy tụ các hãng công nghệ, bán dẫn hàng đầu thế giới đang tập trung vào dự án ViGen với nỗ lực tạo bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá.

 

Từ đó, nâng cao hiệu quả của mô hình ngôn ngữ lớn (LLMs), giúp trí tuệ nhân tao (AI) hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI; đồng thời, góp phần thúc đẩy kinh tế số. Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia (NIC) cho biết, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Ông Trần Việt Hùng, sáng lập mạng lưới STEAM For Vietnam, AI For Vietnam và CEO ViGen cho biết, thực tế các dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8% - một phần rất nhỏ về đầu vào. Việc ứng dụng AI vì vậy chưa hiệu quả. Nhận ra thách thức này, tổ chức AI For Vietnam đã phối hợp với Tập đoàn Meta, NIC mở ra dự án ViGen. Sứ mệnh của dự án là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam.

Ông Sarim Aziz, Giám đốc Chính sách công tại Meta chia sẻ, Tập đoàn Meta (sở hữu Facebook) đang hỗ trợ Việt Nam về mọi mặt trong phát triển AI. Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.

“Chúng tôi cung cấp cho các bạn mô hình AI mã nguồn mở Meta Llama. Cái đó giống như động cơ ô tô và chúng tôi cung cấp miễn phí để các bạn xây dựng nên những chiếc ô tô của riêng mình. ViGen sẽ là nhiên liệu để chạy trên động cơ của chúng tôi ”, ông Sarim Aziz chia sẻ.

Đại diện Meta cho biết, tập đoàn này đang hỗ trợ Việt Nam giải quyết bài toán AI cả về công nghệ, kiến thức lẫn kinh tế. Mô hình Llama là minh chứng rõ ràng nhất. Hiện nay, tại Việt Nam, Llama đã được ứng dụng để xây dựng những trợ lý ảo tự động hóa việc truy xuất thông tin của Misa và trợ lý ảo pháp lý của Viettel. Đây là những ví dụ bước đầu cho thấy ứng dụng của AI trong đời sống người Việt, đặc biệt là ở trong khu vực công.

“Chúng tôi cũng hỗ trợ Việt Nam giúp đào tạo, nâng cao nhận thức về AI với 900.000 học sinh được đào tạo và chúng tôi đang nỗ lực mở rộng việc này”.

Tuy nhiên, Giám đốc Chính sách công của Meta cũng cho hay, Việt Nam đang đối mặt với nhiều thách thức như nhân lực giỏi, dữ liệu tiếng Việt chất lượng cao, hạ tầng số, sự ổn định của chính sách pháp lý… Đây chính là lý do chúng tôi cần có thêm sự hợp tác của Nvidia và Viettel… trong việc giúp Việt Nam phát triển AI.

Ông Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, khi những dự án như: ViGen được triển khai tốt, chúng ta sẽ tận dụng được AI mã nguồn mở và đây chính là cách Việt Nam đứng trên vai người khổng lồ để đi nhanh hơn.

Theo báo cáo của Deloitte, mô hình Llama đang được sử dụng phổ biến tại nhiều nước APAC như: Việt Nam, Hàn Quốc, Singapore, Parkistan…

Đại diện Meta cho biết, Meta mong muốn trong thời gian tới sẽ tiếp tục hợp tác sâu rộng với các công ty công nghệ Việt Nam để phát triển AI theo xu hướng mã nguồn mở. Thông qua các chương trình hợp tác, chúng ta cùng triển khai tối đa tiềm năng công nghệ số và tạo dựng tương lai tốt đẹp hơn.

Dự án ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI; đồng thời, đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cảnh địa phương và có trách nhiệm.

Tin liên quan


Tin cùng chuyên mục