Ra mắt mô hình AI pháp lý tiếng Việt và bộ chuẩn đánh giá
CMC OpenAI (C-OpenAI), một công ty thành viên của Tập đoàn Công nghệ CMC vừa mới công bố hai cấu phần được xem là nền móng để phát triển trợ lý ảo pháp lý tiếng Việt tại Việt Nam: mô hình ngôn ngữ lớn (LLM) pháp lý tiếng Việt CMC-AI-Legal-32B và bộ chuẩn đánh giá pháp lý tiếng Việt VLegal-Bench.
Theo đơn vị, hướng tiếp cận “làm chủ LLM + làm chủ thước đo đánh giá” nhằm hiện thực hóa mục tiêu phát triển công nghệ chiến lược theo tinh thần Nghị quyết 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia, đồng thời bám sát định hướng thúc đẩy phát triển các công nghệ nền tảng, sản phẩm AI chiến lược như LLM tiếng Việt, trợ lý ảo và AI chuyên ngành.
Công bố lần này giới thiệu mô hình CMC-AI-Legal-32B, một mô hình ngôn ngữ lớn tiếng Việt được phát triển theo hướng chuyên biệt cho lĩnh vực pháp luật. Mô hình được xây dựng trên nền tảng có sẵn và tiếp tục tinh chỉnh để phù hợp với hệ thống pháp luật Việt Nam. Theo kết quả đánh giá trên bộ chuẩn VLegal-Bench, CMC-AI-Legal cho thấy hiệu năng tổng thể cao, đứng đầu ở một số tác vụ và thể hiện khả năng xử lý tốt các bài toán yêu cầu suy luận và lập luận pháp lý phức tạp.
Theo nhóm nghiên cứu, các mô hình thương mại tổng quát như GPT-4o, Claude hay Gemini vẫn làm tốt ở nhiệm vụ tổng quát như nhận diện, truy xuất thông tin. Tuy nhiên, khi chuyển sang tác vụ cần suy luận pháp lý phức tạp hoặc tạo lập nội dung pháp lý có cấu trúc, hiệu quả giảm rõ rệt; trong khi mô hình chuyên biệt được huấn luyện theo ngữ cảnh và chuẩn viện dẫn pháp luật Việt Nam cho thấy ưu thế.
Song song phát triển mô hình, C-OpenAI cho biết sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá theo hướng minh bạch, có thể tái sử dụng tại https://vlegalbench.cmcai.vn/; đồng thời kêu gọi chuyên gia trong và ngoài nước tham gia chuẩn hóa để bộ công cụ ngày một tốt hơn.
“C-OpenAI theo đuổi tầm nhìn xây dựng nền tảng AI mở và an toàn do Việt Nam làm chủ, đồng thời phát triển LLM tiếng Việt và mô hình AI chuyên biệt theo từng lĩnh vực, thúc đẩy cộng đồng doanh nghiệp và nhà phát triển cùng xây dựng, phân phối ứng dụng trên nền tảng”, Tổng giám đốc C-OpenAI Đặng Văn Tú chia sẻ.
Theo nhóm phát triển C-OpenAI, muốn huấn luyện và thẩm định LLM pháp lý đạt chất lượng cao, điều kiện tiên quyết là phải có một benchmark đủ chuẩn cho Việt Nam. Đây là phần việc các bộ chuẩn quốc tế khó “làm thay”, do khác biệt ngôn ngữ tiếng Việt và đặc thù của hệ thống dân luật, đòi hỏi đội ngũ trong nước phải tự xây dựng dữ liệu, tác vụ và quy trình đánh giá từ đầu.
VLegal-Bench gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ, thiết kế theo 5 cấp độ suy luận tăng dần: từ nhận diện – truy xuất điều khoản; hiểu và cấu trúc hóa quy phạm theo mục – chương -điều - khoản - điểm - hạ điểm; suy luận đa bước trong tình huống thực tiễn; đến diễn giải - tạo sinh nội dung pháp lý theo văn phong phù hợp và lớp đánh giá liên quan đạo đức, công bằng, thiên lệch.
Bộ chuẩn VLegal-Bench cũng được thiết kế theo đặc thù dân luật của Việt Nam như cấu trúc phân cấp quy phạm, hiệu lực văn bản, quan hệ sửa đổi – thay thế, phạm vi áp dụng và yêu cầu viện dẫn điều luật cụ thể; mỗi mẫu dữ liệu gắn với nguồn văn bản pháp luật cấp trung ương để đảm bảo khả năng kiểm chứng.
“Xây dựng bộ đánh giá VLegal-Bench là một bài toán khó vì nhóm gần như phải thiết kế lại toàn bộ quy trình: từ thu thập, chuẩn hóa văn bản pháp luật Việt Nam đến gán nhãn có trích dẫn và xây dựng các tác vụ phản ánh cả yêu cầu kỹ thuật lẫn nghiệp vụ luật.
Thách thức lớn nhất là bảo đảm tính đúng đắn pháp lý, khả năng tái kiểm chứng và sự tương thích với các chuẩn đánh giá LLM quốc tế. Nhờ phối hợp chặt chẽ giữa chuyên gia luật và kỹ sư AI, chúng tôi hoàn thiện được bộ dữ liệu mẫu và sử dụng 22 mô hình đánh giá để đóng góp cho cộng đồng một bộ bench mark chất lượng cao, làm nền tảng đánh giá cho các trợ lý ảo tiếng Việt pháp lý tại Việt Nam”, ông Nguyễn Tiến Đồng, Giám đốc Kỹ thuật C-OpenAI, đại diện nhóm phát triển cho biết.
C-OpenAI cho biết VLegal-Bench được dùng như một “đấu trường” đối sánh nhiều nhóm mô hình: mã nguồn mở, mã nguồn đóng và mô hình chuyên biệt theo miền pháp lý. Quy trình đánh giá được tự động hóa nhằm đảm bảo tính nhất quán, giảm phụ thuộc vào chấm điểm cảm tính; kết quả đối sánh được công bố theo dạng bảng xếp hạng để cộng đồng có thể tham chiếu.
Ở góc độ học thuật, báo cáo kỹ thuật đã được công bố dưới dạng preprint trên arXiv (kho lưu trữ tiền công bố nghiên cứu khoa học); đồng thời có tham vấn và hợp tác chặt chẽ với đối tác học thuật quốc tế từ Đức nhóm nghiên cứu của Giáo sư Vũ Đức Bình đến từ Đại học SRH Heidelberg nhằm tăng chuẩn mực phản biện và chất lượng nghiên cứu.
Ở cấp tập đoàn, Chủ tịch CMC Nguyễn Trung Chính nhấn mạnh định hướng đầu tư dài hạn vào AI lõi và phát triển mô hình theo ngành: “Ban Lãnh đạo Tập đoàn Công nghệ CMC rất tự hào với thành tựu mà đội ngũ kỹ sư nghiên cứu C-OpenAI đạt được. Tập đoàn đã có hơn 10 năm đầu tư nghiên cứu phát triển (R&D) và sẽ kiên định với con đường này để có được 25 công nghệ lõi made by CMC. Đây là nền tảng vững chắc để CMC có những sản phẩm dịch vụ chuyển đổi số, chuyển đổi AI tầm cỡ thế giới do người Việt làm chủ trên hành trình trở thành một công ty chuyển đổi AI toàn cầu (A Global, AI-X Company)”.
C-OpenAI dự kiến sẽ công bố kho mã nguồn, dữ liệu của VLegal-Bench; mở rộng website kết quả so sánh các mô hình; đồng thời phát hành các phiên bản mở theo từng giai đoạn trong năm 2026, hướng tới tạo nền tảng dùng chung để cộng đồng phát triển ứng dụng AI theo chuyên ngành có những tiêu chuẩn để kiểm chứng. C-OpenAI chủ động tham gia và thúc đẩy các hoạt động vì sự phát triển của cộng đồng AI Việt Nam.
- Từ khóa :
- cmc
- tập đoàn cmc
- mô hình AI pháp lý
Tin liên quan
-
Chứng khoán
Chứng khoán Mỹ lập đỉnh mới trước kỳ nghỉ lễ Giáng sinh
07:24' - 25/12/2025
Chứng khoán Mỹ khép lại phiên giao dịch ngày 24/12 trong sự hứng khởi lan toả, khi chỉ số Dow Jones và S&P 500 đồng loạt đóng cửa ở mức cao kỷ lục.
-
Chứng khoán
Thị trường châu Á hưởng ứng đà tăng kỷ lục của chứng khoán Mỹ
12:32' - 24/12/2025
Đa số các thị trường chứng khoán châu Á tăng điểm trong phiên 24/12, theo sau đà tăng kỷ lục của thị trường chứng khoán Mỹ sau khi dữ liệu tăng trưởng kinh tế của nước này vượt xa dự báo.
Tin cùng chuyên mục
-
Chứng khoán
VN-Index lập đỉnh lịch sử 1.925 điểm: Bước vào giai đoạn kiểm định
10:55'
Dù VN-Index lập đỉnh lịch sử quanh 1.925 điểm, thị trường vẫn phân hóa mạnh và chịu áp lực bán ròng từ khối ngoại. Tuần tới dự báo là giai đoạn kiểm định.
-
Chứng khoán
67 doanh nghiệp chốt quyền họp đại hội cổ đông tuần tới
14:11' - 16/05/2026
Trong tuần tới từ ngày 18-22/5, có 67 doanh nghiệp chốt quyền họp đại hội cổ đông; trong đó có 16 doanh nghiệp trên HoSE; 15 doanh nghiệp trên HNX và 36 doanh nghiệp trên UPCoM.
-
Chứng khoán
Lịch chốt quyền trả cổ tức bằng tiền tuần tới (từ 18-22/5): BMP trả cổ tức khủng 83,6%
14:07' - 16/05/2026
Trong tuần từ 18-22/5, có 51 doanh nghiệp chốt quyền trả cổ tức bằng tiền, trong đó BMP trả cổ tức cao nhất 83,6%, tiếp đến là CCV với 63,16% và MEF với 60% trong khi PVO trả cổ tức thấp nhất 1%.
-
Chứng khoán
VN-Index rung lắc quanh đỉnh 1.920 điểm: Cổ phiếu Năng lượng bứt phá mạnh
16:37' - 15/05/2026
VN-Index giảm nhẹ sau nhịp rung lắc quanh 1.920 điểm, trong khi nhóm năng lượng bứt phá mạnh với GAS, PLX, BSR đồng loạt tăng giá.
-
Chứng khoán
Chứng khoán Hàn Quốc rơi tự do sau khi vượt mức đỉnh lịch sử 8.000 điểm
16:01' - 15/05/2026
Chứng khoán châu Á đồng loạt giảm điểm trong phiên 15/5, với tâm điểm là đà lao dốc mạnh của thị trường Hàn Quốc.
-
Chứng khoán
Tập đoàn PAN sẽ phát hành gần 42 triệu cổ phiếu tăng vốn
11:30' - 15/05/2026
Sau phát hành, vốn điều lệ của PAN dự kiến tăng thêm gần 418 tỷ đồng, lên mức khoảng 2.581 tỷ đồng.
-
Chứng khoán
Cổ phiếu CEO, MCH, DPM và MSN: Loạt mã được khuyến nghị với kỳ vọng tăng trưởng tới 25%
10:52' - 15/05/2026
BVSC và TPS khuyến nghị tích cực cổ phiếu CEO, MCH, DPM và MSN với mục tiêu tăng đến 25%. Phân tích chi tiết động lực từ Vân Đồn, rổ VN30 và tín hiệu kỹ thuật.
-
Chứng khoán
Chứng khoán hôm nay 15/5: 7 doanh nghiệp giao dịch cổ phiếu số lượng lớn
10:52' - 15/05/2026
Hôm nay 15/5, có 7 doanh nghiệp bắt đầu giao dịch cổ phiếu số lượng lớn gồm, trong đó có nhiều giao dịch bán thoái vốn toàn bộ đối với các cổ phiếu như: VNS, LM3, GTD.
-
Chứng khoán
Vốn hóa của Nvidia xác lập mốc kỷ lục 5.700 tỷ USD
10:32' - 15/05/2026
Vốn hóa thị trường của Nvidia đã xác lập cột mốc kỷ lục 5.700 tỷ USD trong phiên giao dịch ngày 14/5, khi cổ phiếu của "gã khổng lồ" chip trí tuệ nhân tạo (AI) này tăng mạnh hơn 4% lên mức cao kỷ lục.

Nền tảng Công nghệ vững chắc của CMC là bệ phóng để C-OpenAI có những bước tiến mạnh mẽ, làm chủ từ R&D đến hoàn thiện các sản phẩm, giải pháp chuyển đổi AI cho doanh nghiệp, tổ chức. Ảnh: CMC
Nhóm nghiên cứu Bộ chuẩn đánh giá VLegal - Bench của nhóm nghiên cứu C-OpenAI. Ảnh: CMC