Dự án ViGen: Nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI
Chương trình Thách thức đổi mới sáng tạo - là sự kiện trong chuỗi Hội nghị quốc tế về "Trí tuệ nhân tạo và Bán dẫn - AISC 2025", sự kiện quy tụ các hãng công nghệ, bán dẫn hàng đầu thế giới đang tập trung vào dự án ViGen với nỗ lực tạo bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá.
Từ đó, nâng cao hiệu quả của mô hình ngôn ngữ lớn (LLMs), giúp trí tuệ nhân tao (AI) hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI; đồng thời, góp phần thúc đẩy kinh tế số. Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia (NIC) cho biết, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
Ông Trần Việt Hùng, sáng lập mạng lưới STEAM For Vietnam, AI For Vietnam và CEO ViGen cho biết, thực tế các dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8% - một phần rất nhỏ về đầu vào. Việc ứng dụng AI vì vậy chưa hiệu quả. Nhận ra thách thức này, tổ chức AI For Vietnam đã phối hợp với Tập đoàn Meta, NIC mở ra dự án ViGen. Sứ mệnh của dự án là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam.
Ông Sarim Aziz, Giám đốc Chính sách công tại Meta chia sẻ, Tập đoàn Meta (sở hữu Facebook) đang hỗ trợ Việt Nam về mọi mặt trong phát triển AI. Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.
“Chúng tôi cung cấp cho các bạn mô hình AI mã nguồn mở Meta Llama. Cái đó giống như động cơ ô tô và chúng tôi cung cấp miễn phí để các bạn xây dựng nên những chiếc ô tô của riêng mình. ViGen sẽ là nhiên liệu để chạy trên động cơ của chúng tôi ”, ông Sarim Aziz chia sẻ.
Đại diện Meta cho biết, tập đoàn này đang hỗ trợ Việt Nam giải quyết bài toán AI cả về công nghệ, kiến thức lẫn kinh tế. Mô hình Llama là minh chứng rõ ràng nhất. Hiện nay, tại Việt Nam, Llama đã được ứng dụng để xây dựng những trợ lý ảo tự động hóa việc truy xuất thông tin của Misa và trợ lý ảo pháp lý của Viettel. Đây là những ví dụ bước đầu cho thấy ứng dụng của AI trong đời sống người Việt, đặc biệt là ở trong khu vực công.
“Chúng tôi cũng hỗ trợ Việt Nam giúp đào tạo, nâng cao nhận thức về AI với 900.000 học sinh được đào tạo và chúng tôi đang nỗ lực mở rộng việc này”.
Tuy nhiên, Giám đốc Chính sách công của Meta cũng cho hay, Việt Nam đang đối mặt với nhiều thách thức như nhân lực giỏi, dữ liệu tiếng Việt chất lượng cao, hạ tầng số, sự ổn định của chính sách pháp lý… Đây chính là lý do chúng tôi cần có thêm sự hợp tác của Nvidia và Viettel… trong việc giúp Việt Nam phát triển AI.
Ông Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, khi những dự án như: ViGen được triển khai tốt, chúng ta sẽ tận dụng được AI mã nguồn mở và đây chính là cách Việt Nam đứng trên vai người khổng lồ để đi nhanh hơn.
Theo báo cáo của Deloitte, mô hình Llama đang được sử dụng phổ biến tại nhiều nước APAC như: Việt Nam, Hàn Quốc, Singapore, Parkistan…
Đại diện Meta cho biết, Meta mong muốn trong thời gian tới sẽ tiếp tục hợp tác sâu rộng với các công ty công nghệ Việt Nam để phát triển AI theo xu hướng mã nguồn mở. Thông qua các chương trình hợp tác, chúng ta cùng triển khai tối đa tiềm năng công nghệ số và tạo dựng tương lai tốt đẹp hơn.
Dự án ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI; đồng thời, đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cảnh địa phương và có trách nhiệm.
Tin liên quan
-
Doanh nghiệp
Kết nối lãnh đạo cấp cao ngành trí tuệ nhân tạo và bán dẫn
20:01' - 14/03/2025
Ngày 14/3, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) phối hợp với CMC tổ chức "Chương trình kết nối Lãnh đạo cấp cao ngành trí tuệ nhân tạo (AI) và bán dẫn" tại Khu công nghệ cao Hoà Lạc, Hà Nội.
-
Công nghệ
Phát triển và sử dụng trí tuệ nhân tạo có trách nhiệm
14:12' - 13/03/2025
Việc phát triển và sử dụng AI có trách nhiệm là một thách thức không nhỏ đối với các cơ quan quản lý và các tổ chức nghiên cứu, ứng dụng công nghệ này.
-
Công nghệ
Chuyển đổi số và trí tuệ nhân tạo định hình xu hướng tuyển dụng
07:13' - 13/03/2025
Dù đối mặt với những thách thức từ căng thẳng địa chính trị và biến động kinh tế toàn cầu, Việt Nam bước vào năm 2025 với tâm thế lạc quan và tập trung vào sự thích ứng.
Tin cùng chuyên mục
-
Doanh nghiệp
Dự án Thủy điện Hòa Bình mở rộng: Hoàn thành tháo dỡ đê quây
21:04' - 15/06/2025
Ngày 15/6, Ban Quản lý dự án Điện 1 (EVNPMB1) cùng các nhà thầu thi công đã hoàn thành tháo dỡ đê quây của Dự án Nhà máy Thủy điện Hòa Bình mở rộng.
-
Doanh nghiệp
TikTok World 2025: Định hình tương lai tiếp thị số
15:44' - 15/06/2025
TikTok vừa tổ chức sự kiện thường niên TikTok World 2025, công bố hàng loạt giải pháp sáng tạo ứng dụng công nghệ AI, hướng đến mục tiêu thúc đẩy tăng trưởng toàn diện cho doanh nghiệp.
-
Doanh nghiệp
Google ra mắt Android 16 phiên bản mới nhất của hệ điều hành di động
08:37' - 14/06/2025
Tập đoàn công nghệ Google đã chính thức công bố hệ điều hành Android 16 - phiên bản mới nhất của hệ điều hành di động phổ biến hàng đầu thế giới.
-
Doanh nghiệp
Công đoàn Điện lực Việt Nam tiếp sức người lao động tại 2 dự án truyền tải điện trọng điểm
20:52' - 13/06/2025
Ngày 13/6, Phó Chủ tịch Công đoàn Điện lực Việt Nam Uông Quang Huy và đoàn công tác đã đến thăm, động viên và đôn đốc tiến độ thi công tại hai dự án trọng điểm do EVNNPT làm chủ đầu tư.
-
Doanh nghiệp
EVNNPC đảm bảo cung cấp điện an toàn, không để xảy ra sự cố lớn
17:10' - 13/06/2025
Bước vào mùa mưa bão, EVNNPC tăng cường kiểm tra lưới điện, đặc biệt tại các điểm xung yếu như vị trí thoát sét, đường dây mang tải cao, thiết bị lâu năm tại trạm biến áp 110kV.
-
Doanh nghiệp
Mitsubishi Corp. lần đầu tiên nhập khẩu LNG từ Canada vào Nhật Bản
08:51' - 13/06/2025
Tập đoàn Mitsubishi Corp. sẽ bắt đầu nhập khẩu khí đốt tự nhiên hóa lỏng (LNG) từ Canada từ tháng 7/2025 và trở thành công ty Nhật Bản đầu tiên mua LNG quy mô lớn từ quốc gia này.
-
Doanh nghiệp
Doanh nghiệp Trung Quốc không từ bỏ thị trường Mỹ
20:14' - 12/06/2025
Với nhiều doanh nghiệp Trung Quốc, Mỹ là thị thị trường lớn nhất, ngang hàng với "quê mẹ" Trung Quốc.
-
Doanh nghiệp
Chuyển đổi số ngành điện: Hiệu quả từ thực tiễn
19:45' - 12/06/2025
Với lộ trình rõ ràng, phương pháp tiếp cận hợp lý, ngành điện lực đang từng bước đưa cuộc sống số đến gần hơn với mọi tầng lớp nhân dân – từ người dân phố thị đến bà con nông thôn.
-
Doanh nghiệp
Hầu hết các phụ tải bị gián đoạn do bão số 1 đã được khôi phục cấp điện
18:48' - 12/06/2025
Ngày 12/6, Công ty Vận hành Hệ thống điện và Thị trường điện Quốc gia (NSMO) vừa có thông tin về diễn biến và tác động của của cơn bão số 1 (WUTIP) đến hệ thống điện khu vực miền Trung.