Viettel AI làm chủ mô hình ngôn ngữ lớn tiếng Việt 120 tỷ tham số

09:06' - 05/06/2026
BNEWS Viettel AI phát triển thành công mô hình ngôn ngữ lớn tiếng Việt VT-Super-120B-A12B với quy mô 120 tỷ tham số, đạt hiệu suất thuộc nhóm dẫn đầu thế giới ở cùng phân khúc.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) vừa công bố phát triển thành công VT-Super-120B-A12B. Đây là mô hình ngôn ngữ lớn (LLM) tiếng Việt có quy mô 120 tỷ tham số, đánh dấu bước tiến quan trọng trong nỗ lực xây dựng và làm chủ hệ thống trí tuệ nhân tạo (AI) chủ quyền tại Việt Nam.

Qua các bài kiểm tra hiệu suất, mô hình do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện và tối ưu hóa này đạt độ chính xác cao, nằm trong nhóm dẫn đầu so với các mô hình có cùng quy mô. Điểm nổi bật của VT-Super-120B-A12B là khả năng tăng cường năng lực xử lý tiếng Việt chuyên sâu nhưng không làm suy giảm hiệu năng tiếng Anh của mô hình gốc. Đồng thời, mô hình đã khắc phục được hiện tượng quên kiến thức cũ, một thách thức phổ biến trong quá trình tinh chỉnh AI.

Sản phẩm được xây dựng trên nền tảng kiến trúc mở NVIDIA Nemotron 3 Super. Nhờ khả năng xử lý ngữ cảnh dài từ kiến trúc này, mô hình có thể duy trì mạch thông tin thông suốt giữa nhiều tài liệu, quy trình và các cuộc hội thoại phức tạp. Năng lực này đặc biệt có ý nghĩa đối với các bài toán vận hành đặc thù tại Việt Nam, nơi các quy định hành chính và quy trình làm việc thường xuyên thay đổi theo bối cảnh hoặc đối tượng cụ thể. Việc sở hữu một mô hình lõi có thể ghi nhớ và thích ứng linh hoạt là cơ sở để Viettel AI tối ưu hóa các ứng dụng AI cho từng cơ quan, tổ chức và doanh nghiệp trong nước.

Để đạt được kết quả này, Viettel AI đã xây dựng quy trình huấn luyện chuyên sâu dựa trên các nguồn dữ liệu mang tính bản địa cao như văn bản hành chính, dữ liệu nghiệp vụ doanh nghiệp, hệ thống văn bản chuyên ngành và hội thoại thực tế. Quy trình bao gồm giai đoạn tiếp tục tiền huấn luyện để mở rộng vốn ngôn ngữ và tri thức tiếng Việt trên kho dữ liệu lớn. Sau đó, mô hình trải qua giai đoạn tinh chỉnh có giám sát nhằm nâng cao khả năng suy luận, kết hợp với học tăng cường để tối ưu hóa độ chính xác trong phản hồi và xử lý nghiệp vụ.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI nhận định, AI đang chuyển dịch từ vai trò hỗ trợ đơn thuần sang lớp hạ tầng công nghệ mới. Do đó, quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ sở hữu lợi thế lớn để tạo ra các hệ thống phục vụ chính xác nhu cầu phát triển. Việc làm chủ LLM tiếng Việt là bước đi cốt lõi của Viettel để hình thành các giải pháp AI chủ quyền, đồng hành thực chất cùng các doanh nghiệp và tổ chức trong nước.

Đánh giá về bước tiến này, bà Shilpa Kolhatkar, Giám đốc AI Nations của NVIDIA, cho rằng việc Viettel thúc đẩy phát triển AI chủ quyền và AI chuyên biệt theo ngành sẽ góp phần phổ cập trí tuệ nhân tạo đến toàn xã hội, biến ngôn ngữ và dữ liệu bản địa thành giá trị ứng dụng thực tế cho khối công và tư nhân.

Hiện tại, Viettel AI đang ứng dụng mô hình này để phát triển nền tảng AI Agent dành cho người Việt, có khả năng tự thực hiện các chuỗi tác vụ phức tạp. Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên được nâng cấp, hướng tới việc hỗ trợ phân tích hồ sơ, đối chiếu quy định và đề xuất giải pháp xử lý chuyên sâu. VT-Super-120B-A12B được định hướng trở thành công nghệ lõi phục vụ đa dạng lĩnh vực từ hành chính công, chăm sóc khách hàng đến vận hành và phân tích dữ liệu doanh nghiệp tại Việt Nam.

 

Tin liên quan


Tin cùng chuyên mục