Chính thức ra mắt hai nền tảng công nghệ về xử lý giọng nói tiếng Việt

20:48' - 19/06/2020
BNEWS Chiều 19/6, tại Hà Nội, Bộ Thông tin và Truyền thông đã tổ chức Lễ ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo có tên là VAIS và Vbee.

Hai sản phẩm công nghệ được ra mắt nằm trong chuỗi sự kiện của Bộ Thông tin và Truyền thông nhằm giới thiệu các nền tảng số “Make in Vietnam” phục vụ công cuộc chuyển đổi số, xây dựng Chính phủ điện tử tại Việt Nam.

Thứ trưởng Bộ Thông tin và Truyền thông Nguyễn Thành Hưng cho biết: Nền tảng chuyển đổi giọng nói tiếng Việt thành văn bản có tên gọi VAIS và Nền tảng giọng nói nhân tạo tiếng Việt tự nhiên có tên gọi Vbee được Bộ Thông tin và Truyền thông lựa chọn giới thiệu, bảo trợ. Đây là hai nền tảng tiên phong tại Việt Nam về công nghệ lõi sử dụng trí tuệ nhân tạo để chuyển đổi giữa giọng nói và văn bản tiếng Việt (Speech–to–Text và Text–to–Speech).

Nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản VAIS có nhiều ưu điểm như khả năng nhận dạng được đầy đủ  giọng nói cả 3 miền Bắc, Trung, Nam với độ chính xác lên đến 95%; chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì với tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh.

Đặc biệt, nền tảng này có thể nhận dạng tốt trong môi trường nhiễu, ở khoảng cách xa và có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số và hỗ trợ nhiều loại định dạng âm thanh đầu vào.

Được đưa vào khai thác sử dụng từ hơn 1 năm nay, tính đến thời điểm hiện tại, nền tảng VAIS hiện đang được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ Thông tin và Truyền thông, UBND Thành phố Hà Nội.

Hơn 50 đơn vị báo chí, truyền hình đang sử dụng nền tảng VAIS để phục vụ gỡ băng bài phát biểu tại các kỳ họp, sự kiện. Hơn 20.000 khách hàng cá nhân và hơn 500 doanh nghiệp, tổng công ty đang sử dụng nền tảng VAIS rộng rãi trong 3 lĩnh vực chính là tổng đài tự động, giải pháp tương tác thiết bị thông minh và nội dung số tự động.

Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc. Điểm ưu việt là nền tảng Vbee có thể học theo bất kỳ giọng của một người nào đó nếu được giao tiếp với người đó trong vòng 4 giờ đồng hồ. Mức độ học theo có độ tương tự trên 95%. Giọng nói Vbee cũng đa dạng vùng miền (Bắc, Trung, Nam), giới tính và độ tuổi.

Công nghệ giọng nói nhân tạo Vbee còn có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không có. Các lĩnh vực sử dụng giọng nói nhân tạo như giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chăm sóc, tư vấn khách hàng qua hộp trả lời tự động (chatbot) đều có thể dựa trên nên tảng Vbee.

Theo nhận định của Thứ trưởng Bộ Thông tin và Truyền thông Nguyễn Thành Hưng, hai nền tảng VAIS và Vbee đang đứng trước một thị trường Việt Nam rộng lớn với hơn 96 triệu dân, 700.000 doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng internet đạt 68,7%.

Ngoài ra, nền tảng chuyển đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan Nhà nước gồm 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.

Hiện hai nền tảng này được cung cấp cho người dùng trực tiếp hoặc kết nối thông qua API tại địa chỉ https://vais.vn/ và https://www.vbee.vn.

Tin liên quan


Tin cùng chuyên mục