Dự án ViGen: Nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI
Chương trình Thách thức đổi mới sáng tạo - là sự kiện trong chuỗi Hội nghị quốc tế về "Trí tuệ nhân tạo và Bán dẫn - AISC 2025", sự kiện quy tụ các hãng công nghệ, bán dẫn hàng đầu thế giới đang tập trung vào dự án ViGen với nỗ lực tạo bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá.
Từ đó, nâng cao hiệu quả của mô hình ngôn ngữ lớn (LLMs), giúp trí tuệ nhân tao (AI) hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI; đồng thời, góp phần thúc đẩy kinh tế số. Ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia (NIC) cho biết, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
Ông Trần Việt Hùng, sáng lập mạng lưới STEAM For Vietnam, AI For Vietnam và CEO ViGen cho biết, thực tế các dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8% - một phần rất nhỏ về đầu vào. Việc ứng dụng AI vì vậy chưa hiệu quả. Nhận ra thách thức này, tổ chức AI For Vietnam đã phối hợp với Tập đoàn Meta, NIC mở ra dự án ViGen. Sứ mệnh của dự án là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam.
Ông Sarim Aziz, Giám đốc Chính sách công tại Meta chia sẻ, Tập đoàn Meta (sở hữu Facebook) đang hỗ trợ Việt Nam về mọi mặt trong phát triển AI. Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.
“Chúng tôi cung cấp cho các bạn mô hình AI mã nguồn mở Meta Llama. Cái đó giống như động cơ ô tô và chúng tôi cung cấp miễn phí để các bạn xây dựng nên những chiếc ô tô của riêng mình. ViGen sẽ là nhiên liệu để chạy trên động cơ của chúng tôi ”, ông Sarim Aziz chia sẻ.
Đại diện Meta cho biết, tập đoàn này đang hỗ trợ Việt Nam giải quyết bài toán AI cả về công nghệ, kiến thức lẫn kinh tế. Mô hình Llama là minh chứng rõ ràng nhất. Hiện nay, tại Việt Nam, Llama đã được ứng dụng để xây dựng những trợ lý ảo tự động hóa việc truy xuất thông tin của Misa và trợ lý ảo pháp lý của Viettel. Đây là những ví dụ bước đầu cho thấy ứng dụng của AI trong đời sống người Việt, đặc biệt là ở trong khu vực công.
“Chúng tôi cũng hỗ trợ Việt Nam giúp đào tạo, nâng cao nhận thức về AI với 900.000 học sinh được đào tạo và chúng tôi đang nỗ lực mở rộng việc này”.
Tuy nhiên, Giám đốc Chính sách công của Meta cũng cho hay, Việt Nam đang đối mặt với nhiều thách thức như nhân lực giỏi, dữ liệu tiếng Việt chất lượng cao, hạ tầng số, sự ổn định của chính sách pháp lý… Đây chính là lý do chúng tôi cần có thêm sự hợp tác của Nvidia và Viettel… trong việc giúp Việt Nam phát triển AI.
Ông Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, khi những dự án như: ViGen được triển khai tốt, chúng ta sẽ tận dụng được AI mã nguồn mở và đây chính là cách Việt Nam đứng trên vai người khổng lồ để đi nhanh hơn.
Theo báo cáo của Deloitte, mô hình Llama đang được sử dụng phổ biến tại nhiều nước APAC như: Việt Nam, Hàn Quốc, Singapore, Parkistan…
Đại diện Meta cho biết, Meta mong muốn trong thời gian tới sẽ tiếp tục hợp tác sâu rộng với các công ty công nghệ Việt Nam để phát triển AI theo xu hướng mã nguồn mở. Thông qua các chương trình hợp tác, chúng ta cùng triển khai tối đa tiềm năng công nghệ số và tạo dựng tương lai tốt đẹp hơn.
Dự án ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI; đồng thời, đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cảnh địa phương và có trách nhiệm.
Tin liên quan
-
Doanh nghiệp
Kết nối lãnh đạo cấp cao ngành trí tuệ nhân tạo và bán dẫn
20:01' - 14/03/2025
Ngày 14/3, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) phối hợp với CMC tổ chức "Chương trình kết nối Lãnh đạo cấp cao ngành trí tuệ nhân tạo (AI) và bán dẫn" tại Khu công nghệ cao Hoà Lạc, Hà Nội.
-
Công nghệ
Phát triển và sử dụng trí tuệ nhân tạo có trách nhiệm
14:12' - 13/03/2025
Việc phát triển và sử dụng AI có trách nhiệm là một thách thức không nhỏ đối với các cơ quan quản lý và các tổ chức nghiên cứu, ứng dụng công nghệ này.
-
Công nghệ
Chuyển đổi số và trí tuệ nhân tạo định hình xu hướng tuyển dụng
07:13' - 13/03/2025
Dù đối mặt với những thách thức từ căng thẳng địa chính trị và biến động kinh tế toàn cầu, Việt Nam bước vào năm 2025 với tâm thế lạc quan và tập trung vào sự thích ứng.
Tin cùng chuyên mục
-
Doanh nghiệp
Đảm bảo truyền tải điện an toàn, liên tục, ổn định mùa nắng nóng
21:14'
Việc đảm bảo điện an toàn, liên tục, ổn định cho mùa nắng nóng năm nay được Thủ tướng Chính phủ, Bộ Công Thương, lãnh đạo EVN đặc biệt quan tâm.
-
Doanh nghiệp
Phê duyệt chủ trương đầu tư dự án đường dây 220kV Than Uyên - 500kV Lào Cai
08:25'
Phó Thủ tướng Bùi Thanh Sơn vừa ký ban hành Quyết định số 857/QĐ-TTg về việc chấp thuận chủ trương đầu tư đồng thời chấp thuận nhà đầu tư dự án đường dây 220kV Than Uyên - 500kV Lào Cai.
-
Doanh nghiệp
Hoàn thành 50 công trình 110kV chào mừng 50 năm Ngày giải phóng miền Nam
15:47' - 29/04/2025
EVNSPC đã chính thức hoàn thành 50 công trình lưới điện 110kV chào mừng 50 năm ngày Giải phóng miền Nam, thống nhất đất nước và 50 năm xây dựng và phát triển EVNSPC (30/4/1975 – 30/4/2025).
-
Doanh nghiệp
Walmart tiếp tục thống trị thị trường Mỹ
14:02' - 29/04/2025
Theo dữ liệu từ công ty phân tích người tiêu dùng Numerator, đây là năm thứ ba liên tiếp, cứ 5 USD người Mỹ chi tiêu cho hàng tạp hóa thì có hơn 1 USD được tiêu tại Walmart.
-
Doanh nghiệp
M&S thiệt hại hơn 900 triệu USD do bị tấn công mạng
13:19' - 29/04/2025
Một cuộc tấn công mạng đã gây thiệt hại gần 700 triệu bảng Anh (940 triệu USD) cho hãng bán lẻ Marks & Spencer (M&S) nổi tiếng của Anh.
-
Doanh nghiệp
5 năm liền EVNNPT được Fitch Ratings xếp hạng tín nhiệm BB+
13:19' - 29/04/2025
Theo Tổng giám đốc Tổng công ty Truyền tải điện Quốc gia (EVNNPT), trong 5 năm liên tiếp (2020-2025), EVNNPT được tổ chức Fitch Ratings xếp hạng tín nhiệm BB+.
-
Doanh nghiệp
Tập đoàn CMC dự kiến doanh thu từ thị trường Nhật Bản đến năm 2028 đạt 200 - 250 triệu USD
10:47' - 29/04/2025
Theo lãnh đạo Tập đoàn Công nghệ CMC, trong hành trình toàn cầu hóa, Nhật Bản luôn là thị trường chiến lược của CMC.
-
Doanh nghiệp
Phục vụ tốt nhất nhu cầu liên lạc của người dân trong dịp nghỉ lễ 30/4-1/5
10:24' - 29/04/2025
Các Tập đoàn Bưu chính Viễn thông Việt Nam, Tập đoàn Công nghiệp - Viễn thông Quân đội và Tổng công ty Viễn thông MobiFone đã chuẩn bị lỹ lưỡng, đảm bảo thông tin liên lạc thông suốt dịp lễ 30/4-1/5.
-
Doanh nghiệp
Đóng điện dự án đường dây 220kV Huội Quảng – Nghĩa Lộ và dự án Trạm biến áp 220kV Nghĩa Lộ
08:17' - 29/04/2025
Hai dự án sau khi hoàn thành giúp giải phóng công suất từ các nhà máy thủy điện vừa và nhỏ khu vực Tây Bắc.