Viện CMC ATI đạt nhiều giải thưởng về ứng dụng trí tuệ nhân tạo và xử lý ngôn ngữ 

19:24' - 12/01/2023
BNEWS CMC ATI đã đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo, đồng thời nhận cú đúp giải thưởng tại cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt - VLSP 2022.

Mới đây, Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo năm 2022 với giải pháp số hóa, chuyển đổi số toàn diện văn bản, hồ sơ giấy tờ dạng ảnh C-ORC.

Hội thi Giải pháp ứng dụng trí tuệ nhân tạo lần 3 do Sở Thông tin và Truyền thông, Thành đoàn phối hợp Đại học Quốc gia Tp. Hồ Chí Minh, Hiệp hội phần mềm và dịch vụ công nghệ thông tin Việt Nam tổ chức nhằm tìm kiếm các giải pháp ứng dụng trí tuệ nhân tạo vào các lĩnh vực cuộc sống.

Hội thi năm nay có 210 đội thi, gồm có 2 nhóm dự thi: nhóm 1 là thử thách trí tuệ nhân tạo (AI Challenge) với chủ đề "Truy vấn sự kiện từ dữ liệu thị giác" (Event Retrieval from Visual Data) được tổ chức theo chuẩn của các cuộc thi quốc tế; nhóm 2 là sản phẩm ứng dụng trí tuệ nhân tạo (AI solution). 

Anh Nguyễn Tiến Đồng, đại diện đội CMC ATI  tham dự cuộc thi cho biết, nhóm nghiên cứu, giải pháp có thể số hóa toàn bộ các dạng tài liệu, văn bản, kể cả văn bản viết tay, biểu mẫu, hồ sơ... phục vụ các thủ tục hành chính. Riêng văn bản chữ viết tay, mô hình của nhóm có thể nhận dạng với độ chính xác trên 95% dựa trên việc cho máy học trên tập hơn 10.000 loại dữ liệu viết tay tiếng Việt.

Bên cạnh đó, nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) tiếp tục nhận cú đúp giải thưởng tại cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt - VLSP 2022 (Vietnamese Language and Speech Processing) với một giải Nhất và một giải Ba.

Đây là cuộc thi được Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam tổ chức lần thứ 9. VLSP 2022 tổ chức 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.

Cụ thể, nhóm CMC AI đạt giải Nhất với giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”. Đồng thời, nhóm còn giành được giải Ba với giải pháp “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” tại Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt”.

 

Với cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”, các đội phải giải bài toán nghiên cứu đa lĩnh vực: Xử lý ngôn ngữ tự nhiên và Xử lý ảnh. Cuộc thi này xuất hiện lần đầu tiên tại VLSP 2022. Nhiệm vụ của các nhóm là xây dựng những mô hình/hệ thống phải có khả năng trả lời câu hỏi về nội dung ảnh bằng ngôn ngữ tự nhiên. Thêm một thách thức nữa cho các đội là câu hỏi có thể bằng tiếng Việt, tiếng Anh hoặc tiếng Nhật. 

Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” (VLSP Abmusu) là một trong các tác vụ xử lý ngôn ngữ rất hữu ích để giải quyết vấn đề khai thác dữ liệu văn bản. Trong thời đại bùng nổ thông tin, khai thác dữ liệu một cách hiệu quả có tiềm năng rất lớn nhưng lại là một bài toán khó, tốn nhiều thời gian, tiền bạc và công sức. Nhận một tập tài liệu đầu vào, hệ thống tóm tắt phải chọn lọc hoặc tạo sinh một bản tóm tắt ngắn gọn cho các tài liệu này.

Để đạt được giải nhất trong cuộc thi VLSP 2022, team CMC AI đã thử nghiệm nhiều thuật toán khác nhau để tìm được ra thuật toán tốt nhất. Kết quả được đánh giá trên hệ thống do ban tổ chức cuộc thi cung cấp và team đã vượt qua 27 đội dự thi khác như Viettel, VinGroup, VCCorp, TopCV… để đạt được vị trí dẫn đầu.

Toàn bộ cuộc thi diễn ra trong khoảng hơn một tháng; trong đó, thời gian để các đội thi đăng ký, chuẩn bị là khoảng 3 tuần. Thời gian để các đội nộp bài thi và cạnh tranh với nhau trên bảng xếp hạng kéo dài trong 10 ngày./. 

Tin liên quan


Tin cùng chuyên mục