Giải pháp số hóa văn bản do người Việt sáng tạo

14:00' - 03/08/2025
BNEWS Chuyển đổi số đang phát triển mạnh mẽ, kéo theo nhu cầu số hóa tài liệu giấy, đặc biệt là văn bản phức tạp, bảng biểu và chữ viết tay tiếng Việt.
Từ thực tiễn ấy, nhóm tác giả đến từ Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel đã nghiên cứu thành công công trình “Phát triển công nghệ trích xuất thông tin từ ảnh văn bản có đa dạng bố cục, bảng biểu và chữ viết tay tiếng Việt”. Công trình vừa được trao giải Khuyến khích tại Giải thưởng Sáng tạo Khoa học Công nghệ Việt Nam năm 2024, đánh dấu bước tiến quan trọng của ngành công nghệ Việt Nam trong việc làm chủ nền tảng số phù hợp với đặc thù trong nước.

*Từ nhu cầu thực tiễn đến sản phẩm có giá trị ứng dụng cao

Theo Kỹ sư Trần Tuấn Anh, Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel, chủ nhiệm công trình, ý tưởng xây dựng nền tảng công nghệ này xuất phát từ nhu cầu cấp thiết trong quá trình chuyển đổi số, nhất là trong lĩnh vực hành chính công và tài chính, ngân hàng. Kỹ sư Trần Tuấn Anh cho rằng, tại Việt Nam, số lượng văn bản giấy cần số hóa là rất lớn, nhưng chúng lại có cấu trúc, định dạng và ngôn ngữ rất đa dạng. Nhiều tài liệu chứa bảng biểu, biểu mẫu viết tay hoặc bố cục không thống nhất, gây khó khăn cho các hệ thống công nghệ sẵn có, vốn phần lớn được thiết kế phục vụ ngôn ngữ và quy chuẩn nước ngoài.

Kỹ sư Trần Tuấn Anh cho biết thêm, nhóm nghiên cứu đã xây dựng một nền tảng có thể xử lý cả ba loại biểu mẫu: biểu mẫu cố định, biểu mẫu tự do và biểu mẫu bán cố định. Đây là một bước tiến mang tính đột phá, vì nền tảng không chỉ “đọc hiểu” được văn bản đánh máy mà còn xử lý được cả chữ viết tay tiếng Việt, điều mà rất ít nền tảng hiện có trên thị trường đáp ứng được. Với cấu trúc mở, sản phẩm có thể tùy biến để ứng dụng trong nhiều lĩnh vực khác nhau, từ đăng ký dịch vụ công trực tuyến, định danh người dùng, đến tự động hóa quy trình xử lý hồ sơ trong doanh nghiệp.

 
Chủ nhiệm công trình Trần Tuấn Anh cho rằng, nhóm không phát triển các phần mềm riêng lẻ, mà xây dựng nền tảng công nghệ lõi có khả năng ghép nối linh hoạt các mô đun theo yêu cầu cụ thể. Cách tiếp cận này giúp giảm thời gian triển khai, tiết kiệm chi phí và phù hợp với nhu cầu thực tế của từng cơ quan, tổ chức, doanh nghiệp. Một số mô đun đã được ứng dụng thành công như: nhận diện chữ viết quang học, phân tích bảng biểu, trích xuất thông tin thông minh…

Theo Kỹ sư Trần Tuấn Anh, hệ thống công nghệ xử lý văn bản do nhóm nghiên cứu phát triển, có thể được triển khai linh hoạt dưới nhiều hình thức, phù hợp với nhu cầu của từng đơn vị, từ lưu trữ đám mây đến tích hợp vào hạ tầng của khách hàng. Nhờ đó, sản phẩm phù hợp với nhiều đối tượng sử dụng, từ cơ quan quản lý nhà nước, doanh nghiệp lớn, đến tổ chức nhỏ và vừa. Đặc biệt, với việc làm chủ toàn bộ công nghệ, sản phẩm không phụ thuộc vào nền tảng nào của nước ngoài, đảm bảo bảo mật dữ liệu và tối ưu cho ngôn ngữ, văn bản tiếng Việt.

Kỹ sư Trần Tuấn Anh cho rằng, hiệu quả của công trình không chỉ thể hiện qua việc được triển khai tại nhiều đơn vị trong nước mà còn ở khả năng thương mại hóa rõ ràng. Chỉ riêng trong ba năm gần đây, các sản phẩm ứng dụng công nghệ nền tảng này đã mang về doanh thu lên tới hàng chục tỷ đồng mỗi năm, bao gồm cả dịch vụ định danh điện tử, quản lý văn bản thông minh và các giải pháp hỗ trợ chuyển đổi số tại địa phương.

Dựa trên nền tảng công nghệ vững chắc, cùng tinh thần đổi mới sáng tạo xuất phát từ thực tiễn, Kỹ sư Trần Tuấn Anh tin rằng sản phẩm không chỉ phục vụ tốt cho nhu cầu trong nước mà còn có khả năng vươn ra thị trường quốc tế, nhất là các nước có ngôn ngữ riêng biệt và cấu trúc văn bản phức tạp như Việt Nam. Kỹ sư Trần Tuấn Anh bày tỏ kỳ vọng, trong thời gian tới, nhiều tổ chức trong và ngoài nước sẽ quan tâm ứng dụng giải pháp này như một phần trong chiến lược chuyển đổi số toàn diện.

*Nghị quyết 57 mở đường cho sáng chế khoa học đi vào cuộc sống

Theo nhóm tác giả, một trong những yếu tố quan trọng giúp công trình không chỉ nằm trên giấy tờ hay trong phòng nghiên cứu mà có thể ứng dụng thực tế nhờ vào chính sách hỗ trợ của Đảng và Nhà nước, đặc biệt là Nghị quyết số 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Kỹ sư Trần Tuấn Anh cho rằng, Nghị quyết 57 đã tạo ra một hành lang chính sách rõ ràng và tích cực. “Trước đây, nhiều nhóm nghiên cứu gặp khó khăn trong việc tiếp cận doanh nghiệp hoặc triển khai sản phẩm vào thực tế. Nhờ có Nghị quyết, chúng tôi được kết nối, được hỗ trợ và đặc biệt là được công nhận về mặt pháp lý lẫn thương mại. Đây là con đường giúp khoa học thực sự bước ra khỏi phòng nghiên cứu để đồng hành cùng cuộc sống”. Trên thực tế, nhờ cơ chế mở từ Nghị quyết 57, nhiều đơn vị chủ quản, đặc biệt là doanh nghiệp nhà nước và tổ chức nghiên cứu công lập đã mạnh dạn đầu tư, đặt hàng và thử nghiệm các sản phẩm khoa học do người Việt sáng tạo. Điều này không chỉ giúp các công trình khoa học sớm có “đầu ra”, mà còn tạo môi trường cạnh tranh lành mạnh giữa công nghệ nội địa với sản phẩm nhập khẩu, khơi dậy tinh thần đổi mới sáng tạo trong cộng đồng nghiên cứu trẻ.

Theo Kỹ sư Trần Tuấn Anh, đối với nhóm của Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel, Nghị quyết 57 đã góp phần tạo cầu nối hiệu quả giữa nhóm nghiên cứu và các đơn vị ứng dụng, từ đó hình thành hàng loạt hợp đồng chuyển giao công nghệ. Trong tương lai, nhóm mong muốn chính sách này tiếp tục được cụ thể hóa bằng các hướng dẫn chi tiết và ưu đãi thực chất hơn cho doanh nghiệp ứng dụng công nghệ nội địa, nhằm đưa nhiều sáng chế Việt Nam đến gần hơn với người dân, phục vụ hiệu quả quá trình chuyển đổi số quốc gia.

Tin liên quan


Tin cùng chuyên mục