AI: Điểm yếu nguy hiểm của ngôn ngữ ít dữ liệu

Hương Giang/Vnanet.vn
13:10' - 28/03/2026

BNEWS Trong vài năm qua, trí tuệ nhân tạo (AI) đã bước ra khỏi phòng thí nghiệm để đi vào đời sống, từ lớp học, văn phòng cho đến phòng khám.

Những mô hình ngôn ngữ lớn (LLM) được ca ngợi như những “bộ não biết nói”, có thể tư vấn, phân tích, thậm chí hỗ trợ con người ra quyết định.

Trí tuệ nhân tạo ngày càng hiện diện ở nhiều lĩnh vực. Ảnh minh hoạ

Nhưng đằng sau vẻ trơn tru ấy, có một khoảng trống âm thầm: AI không "giỏi" mọi ngôn ngữ và tiếng Anh luôn chiếm ưu thế. Đôi khi, sự thiếu công bằng đó không chỉ là vấn đề kỹ thuật mà là vấn đề sinh tử. Hãy hình dung một câu hỏi tưởng chừng đơn giản: một phụ nữ mang thai bị phù chân vào cuối thai kỳ nên làm gì? Với người hỏi bằng tiếng Anh, câu trả lời của AI có thể rất chuẩn xác: cần cảnh giác với tiền sản giật, một biến chứng nguy hiểm. Nhưng với người hỏi bằng một ngôn ngữ khác, tiếng Swahili (ngôn ngữ phổ biến ở khu vực Đông Phi) chẳng hạn, câu trả lời lại có thể là: “Bạn không cần lo lắng”.

Phóng viên TTXVN tại London dẫn kết quả của một nghiên cứu mới đây cho thấy độ chính xác của mô hình ở những ngôn ngữ ngoài tiếng Anh có thể thấp hơn tới gần 30 điểm phần trăm. Trong trường hợp tệ nhất, một mô hình có thể trả lời đúng khoảng 75% câu hỏi bằng tiếng Anh lại chỉ đạt 22,6% ở ngôn ngữ khác. Một sự chênh lệch như vậy, nếu xảy ra trong lĩnh vực y tế hay pháp lý, không còn là lỗi công nghệ, mà là rủi ro xã hội.

Điều đáng nói là thế giới không vận hành bằng một ngôn ngữ duy nhất. Khi các tổ chức quốc tế bắt đầu triển khai AI ở những khu vực đang phát triển – từ châu Phi đến Đông Nam Á – những cộng đồng không nói tiếng Anh lại là những đối tượng được kỳ vọng sẽ hưởng lợi nhiều nhất. Trớ trêu thay, đây lại là nhóm ít có khả năng tận dụng các công cụ này, bởi các mô hình AI hiện tại vẫn xử lý các ngôn ngữ ít dữ liệu (không phải tiếng Anh) một cách kém hiệu quả.

Vấn đề không chỉ nằm ở dữ liệu, mà còn nằm ở cách AI “nghĩ”. Phần lớn các mô hình hiện nay được huấn luyện trên kho dữ liệu khổng lồ bằng tiếng Anh. Khi gặp một ngôn ngữ khác, các mô hình thường “dịch ngược” về tiếng Anh để xử lý, rồi mới trả lời lại. Quy trình hai bước ấy nghe có vẻ hợp lý, nhưng thực chất lại mở ra thêm nhiều tầng sai lệch.

Ngay cả ở cấp độ kỹ thuật sâu hơn, sự thiên lệch cũng đã được “lập trình” từ đầu. Các mô hình xử lý văn bản bằng cách chia nhỏ thành “token” — những đơn vị ngôn ngữ cơ bản. Vì được huấn luyện chủ yếu bằng tiếng Anh, chúng phân mảnh các ngôn ngữ khác kém hiệu quả hơn. Cùng một câu có thể cần nhiều token hơn gấp nhiều lần ở ngôn ngữ khác… khiến chi phí tăng lên đáng kể. Điều đó có nghĩa là không chỉ kém chính xác hơn, người dùng ở các ngôn ngữ khác còn phải trả giá đắt hơn - theo cả nghĩa đen lẫn nghĩa bóng.

Một phản ứng tự nhiên là “trộn” thêm tiếng Anh vào câu hỏi, hy vọng AI sẽ hiểu rõ hơn, song điều này lại phản tác dụng. Theo nghiên cứu, việc trộn nhiều ngôn ngữ trong cùng một câu hỏi… thường làm hiệu suất giảm thêm. Thay vì giúp mô hình bám vào điểm tựa, hệ thống rơi vào trạng thái nhiễu loạn giữa các ngôn ngữ.

Điều đáng suy ngẫm không chỉ là AI chưa hoàn hảo, mà là con người đang quá nhanh chóng tin vào sự hoàn hảo ấy. Khi một công nghệ được triển khai ở quy mô toàn cầu, mọi sai lệch nhỏ đều có thể nhân lên thành hệ quả lớn. Một câu trả lời sai trong tiếng Anh có thể được kiểm chứng lại, nhưng một câu trả lời sai trong một ngôn ngữ ít phổ biến có thể không bao giờ bị phát hiện.

Mặc dù vậy, vẫn có những tín hiệu tích cực. Chỉ cần bổ sung một lượng nhỏ dữ liệu chất lượng cao bằng ngôn ngữ địa phương, hiệu suất của mô hình đã có thể cải thiện đáng kể. Nhưng đó mới chỉ là bước đầu. Điều cần thiết hơn là một cách tiếp cận công bằng ngay từ gốc: xây dựng AI không chỉ “biết nhiều”, mà còn “hiểu đều các ngôn ngữ”. Nếu không, trí tuệ nhân tạo thay vì thu hẹp khoảng cách tri thức, lại có nguy cơ đào sâu thêm những bất bình đẳng vốn đã tồn tại. Khi đó, câu hỏi không còn là AI thông minh đến đâu, mà là: AI đang phục vụ ai.

Hương Giang/Vnanet.vn

Tin cùng chuyên mục

Công nghệ
Kỷ nguyên trí tuệ nhân tạo và bài toán cân bằng
14:33' - 29/06/2026
Theo phóng viên TTXVN tại Tel Aviv, các chuyên gia và doanh nghiệp công nghệ Israel cho rằng trí tuệ nhân tạo (AI) đang tạo ra những thay đổi sâu sắc đối với thị trường lao động và nền kinh tế số.
Công nghệ
Tận dụng AI phát hiện sớm cháy rừng bằng âm thanh
07:30' - 29/06/2026
Trong bối cảnh mùa Hè bước vào cao điểm và nguy cơ cháy rừng gia tăng, một startup công nghệ Firewave đang phát triển giải pháp AI nhằm phát hiện hỏa hoạn ngay từ giai đoạn sớm nhất.
Công nghệ
Ứng dụng y học số giúp nâng cao hiệu quả điều trị bệnh lý tim mạch
13:00' - 28/06/2026
Các nghiên cứu mới nhất trên thế giới chỉ ra rằng, điều trị suy tim hiện nay cần được triển khai sớm, đầy đủ và có hệ thống; đồng thời quản lý người bệnh theo từng kiểu hình.
Công nghệ
Công nghệ làm mát đô thị để ứng phó nắng nóng cực đoan
07:30' - 28/06/2026
Công nghệ này cho phép đẩy một phần năng lượng Mặt Trời trở lại khí quyển thay vì hấp thụ vào công trình, từ đó giảm nhu cầu sử dụng điều hòa và góp phần cắt giảm phát thải khí nhà kính.
Công nghệ
Khoác “áo số” cho di sản nghìn năm Tháp Bà Pô Nagar
13:00' - 27/06/2026
Việc áp dụng công nghệ vào di tích không thuần túy là xu hướng kỹ thuật mà là phương thức diễn giải di sản mới, sinh động và bền vững hơn.
Công nghệ
Thái Lan: “Tiếp sức số” cho nông dân
08:00' - 27/06/2026
Theo kế hoạch, chương trình sẽ đào tạo miễn phí theo hình thức trực tiếp và trực tuyến cho ít nhất 2.000 nông dân và doanh nghiệp SMEs trong lĩnh vực nông nghiệp.
Công nghệ
Đấu giá tên miền .vn: Ok.vn đạt mức trả giá cao nhất 109 triệu đồng
16:17' - 26/06/2026
Đợt 2 đấu giá cấp quyền sử dụng tên miền quốc gia Việt Nam “.vn” có độ dài 2 ký tự tiếp tục ghi nhận sự quan tâm tích cực của cộng đồng trong hai ngày 24 và 25/6.
Công nghệ
OpenAI cân nhắc hoãn IPO đến năm 2027
15:21' - 26/06/2026
Theo báo cáo vừa công bố từ New York Times, OpenAI đang xem xét hoãn kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) cho đến năm 2027.
Công nghệ
Hướng đi mới cho pin nhiên liệu hydro
13:00' - 26/06/2026
Theo các nhà khoa học, công nghệ này có tiềm năng ứng dụng trong ô tô chạy bằng hydro, tàu hỏa, máy bay không người lái, tàu thủy, hệ thống điện phân tán.

Tin nổi bật

Điểm báo trong tuần

Theo baodautu.vn
Xây dựng Hòa Bình tính lập Hoa Binh Invest Holdings

Tập đoàn Xây dựng Hòa Bình cho biết dự kiến thành lập Hoa Binh Invest Holdings để huy động nguồn lực, kết nối nhà đầu tư và hỗ trợ chiến lược mở rộng quốc tế, trong khi Xây dựng Hòa Bình tiếp tục tập trung vào mảng tổng thầu xây dựng.
Theo baodautu.vn
Tỷ phú Trần Đình Long "bắt tay" đại gia Trần Đăng Khoa thành lập doanh nghiệp

CTCP Tập đoàn Hòa Phát vừa có bước đi đáng chú ý trong lĩnh vực năng lượng tái tạo khi tham gia thành lập CTCP Điện gió ngoài khơi Sông Hậu với vốn điều lệ 2.000 tỷ đồng. Đáng chú ý, cơ cấu cổ đông sáng lập của doanh nghiệp này có sự góp mặt của ông Trần Đình Long, Chủ tịch HĐQT Hòa Phát và ông Trần Đăng Khoa, Chủ tịch HĐQT CTCP Đại Quang Minh.
Theo baodautu.vn
Nam Tân Uyên tính làm nhà ở xã hội

Nam Tân Uyên cam kết hoàn thành tiến độ xây dựng hạ tầng KCN Nam Tân Uyên mở rộng - giai đoạn 2 (NTC3) trong tháng 7. Đồng thời, nghiên cứu kết hợp với nhà đầu tư Hàn Quốc để thực hiện đầu tư nhà ở xã hội trong thời gian tới.
Theo baodautu.vn
Taseco Hải Phòng bất ngờ giải thể

Thông tin trên được cho biết trong một thông báo thay đổi nhân sự của CTCP Đầu tư Bất động sản Taseco (Taseco Land).
Theo vietnamfinance.vn
Cường Thịnh Thi: Nhà thầu xây dựng có tiếng tham vọng làm năng lượng tái tạo

Từ một doanh nghiệp thuần xây dựng hạ tầng kỹ thuật tại Ninh Bình, Công ty cổ phần Tập đoàn Đầu tư xây dựng Cường Thịnh Thi đang từng bước cho thấy tham vọng mở rộng sang lĩnh vực năng lượng tái tạo. Những động thái mới nhất tại Thanh Hóa hé lộ chiến lược dài hạn của doanh nghiệp này, được hậu thuẫn bởi nền tảng tài chính hàng nghìn tỷ đồng được tích lũy trong suốt nhiều năm.
Theo vietnamfinance.vn
Aeon Mall sắp mở thêm trung tâm thương mại 3.900 tỷ tại Việt Nam

Aeon Mall tiếp tục mở rộng thị phần tại Việt Nam bằng dự án quy mô khoảng 7,7ha, tổng vốn đầu tư dự kiến hơn 3.900 tỷ đồng tại Bắc Ninh.
Theo vnexpress.net
Trung Nguyên Legend khởi công hệ thống nhà máy cà phê gần 2.200 tỷ đồng

Tập đoàn Trung Nguyên Legend khởi công và động thổ hệ thống nhà máy hiện đại, với tổng vốn đầu tư gần 2.200 tỷ đồng, đẩy mạnh chế biến sâu cà phê Việt Nam.
Theo vietnamfinance.vn
Lotte và Phát Đạt chính thức ký hợp tác đầu tư dự án Lotte Eco Smart City Thu Thiem

Tập đoàn Lotte và Công ty Cổ phần Phát triển Bất động sản Phát Đạt vừa ký kết hợp đồng hợp tác đầu tư dự án Lotte Eco Smart City Thu Thiem. Sự kiện đánh dấu bước tiến quan trọng trong việc triển khai một trong những dự án đô thị có quy mô và vị trí chiến lược bậc nhất tại khu đô thị mới Thủ Thiêm, TP. HCM.
Theo vietnamfinance.vn
VinEnergo và loạt DN rót hơn 14.000 tỷ đồng vào năng lượng tại Gia Lai

UBND tỉnh Gia Lai vừa ban hành các quyết định chấp thuận chủ trương đầu tư đồng thời chấp thuận nhà đầu tư đối với 10 dự án năng lượng tái tạo và thủy điện, với tổng vốn đầu tư hơn 14.018 tỷ đồng.
Theo vietnamfinance.vn
Hòa Phát lấn sân điện gió ngoài khơi, góp vốn lập công ty 2.000 tỷ đồng

Tập đoàn Hòa Phát vừa có bước đi mới trong lĩnh vực năng lượng tái tạo khi quyết định góp vốn thành lập CTCP Điện gió ngoài khơi Sông Hậu với vốn điều lệ 2.000 tỷ đồng.

Tin mới

AI: Điểm yếu nguy hiểm của ngôn ngữ ít dữ liệu

Tin liên quan

Nâng cao năng lực chuyển đổi số cho lãnh đạo, quản lý và công chức

Drone và công nghệ số giúp nông dân Đồng Tháp tăng lợi nhuận

Chuyển đổi số và AI đang làm thay đổi hệ sinh thái của ngành Dược

Phát triển thị trường lao động gắn với chuyển đổi số

Tháng Thanh niên 2026: Tuổi trẻ tiên phong chuyển đổi số

Tin cùng chuyên mục

Kỷ nguyên trí tuệ nhân tạo và bài toán cân bằng

Tận dụng AI phát hiện sớm cháy rừng bằng âm thanh

Ứng dụng y học số giúp nâng cao hiệu quả điều trị bệnh lý tim mạch

Công nghệ làm mát đô thị để ứng phó nắng nóng cực đoan

Khoác “áo số” cho di sản nghìn năm Tháp Bà Pô Nagar

Thái Lan: “Tiếp sức số” cho nông dân

Đấu giá tên miền .vn: Ok.vn đạt mức trả giá cao nhất 109 triệu đồng

OpenAI cân nhắc hoãn IPO đến năm 2027

Hướng đi mới cho pin nhiên liệu hydro

Quy hoạch Thủ đô 100 năm: Phép thử năng lực hiện thực hóa tầm nhìn

Lãnh đạo Fed cảnh báo lạm phát Mỹ ở mức cao

Toàn cảnh Quy hoạch Thủ đô Hà Nội 100 năm sẽ được trình chiếu 3D tại Bảo tàng Hà Nội

Triển khai nhiệm vụ trọng tâm 6 tháng cuối năm 2026 của Ban Chỉ đạo 35 Trung ương

Động đất tại Venezuela: Chạy đua cứu hộ sau 72 giờ vàng

Xây dựng Hòa Bình tính lập Hoa Binh Invest Holdings

Tỷ phú Trần Đình Long "bắt tay" đại gia Trần Đăng Khoa thành lập doanh nghiệp

Nam Tân Uyên tính làm nhà ở xã hội

Taseco Hải Phòng bất ngờ giải thể

Cường Thịnh Thi: Nhà thầu xây dựng có tiếng tham vọng làm năng lượng tái tạo

Aeon Mall sắp mở thêm trung tâm thương mại 3.900 tỷ tại Việt Nam

Trung Nguyên Legend khởi công hệ thống nhà máy cà phê gần 2.200 tỷ đồng

Lotte và Phát Đạt chính thức ký hợp tác đầu tư dự án Lotte Eco Smart City Thu Thiem

VinEnergo và loạt DN rót hơn 14.000 tỷ đồng vào năng lượng tại Gia Lai

Hòa Phát lấn sân điện gió ngoài khơi, góp vốn lập công ty 2.000 tỷ đồng