AI: Điểm yếu nguy hiểm của ngôn ngữ ít dữ liệu
Những mô hình ngôn ngữ lớn (LLM) được ca ngợi như những “bộ não biết nói”, có thể tư vấn, phân tích, thậm chí hỗ trợ con người ra quyết định.
Nhưng đằng sau vẻ trơn tru ấy, có một khoảng trống âm thầm: AI không "giỏi" mọi ngôn ngữ và tiếng Anh luôn chiếm ưu thế. Đôi khi, sự thiếu công bằng đó không chỉ là vấn đề kỹ thuật mà là vấn đề sinh tử. Hãy hình dung một câu hỏi tưởng chừng đơn giản: một phụ nữ mang thai bị phù chân vào cuối thai kỳ nên làm gì? Với người hỏi bằng tiếng Anh, câu trả lời của AI có thể rất chuẩn xác: cần cảnh giác với tiền sản giật, một biến chứng nguy hiểm. Nhưng với người hỏi bằng một ngôn ngữ khác, tiếng Swahili (ngôn ngữ phổ biến ở khu vực Đông Phi) chẳng hạn, câu trả lời lại có thể là: “Bạn không cần lo lắng”.
Phóng viên TTXVN tại London dẫn kết quả của một nghiên cứu mới đây cho thấy độ chính xác của mô hình ở những ngôn ngữ ngoài tiếng Anh có thể thấp hơn tới gần 30 điểm phần trăm. Trong trường hợp tệ nhất, một mô hình có thể trả lời đúng khoảng 75% câu hỏi bằng tiếng Anh lại chỉ đạt 22,6% ở ngôn ngữ khác. Một sự chênh lệch như vậy, nếu xảy ra trong lĩnh vực y tế hay pháp lý, không còn là lỗi công nghệ, mà là rủi ro xã hội.
Điều đáng nói là thế giới không vận hành bằng một ngôn ngữ duy nhất. Khi các tổ chức quốc tế bắt đầu triển khai AI ở những khu vực đang phát triển – từ châu Phi đến Đông Nam Á – những cộng đồng không nói tiếng Anh lại là những đối tượng được kỳ vọng sẽ hưởng lợi nhiều nhất. Trớ trêu thay, đây lại là nhóm ít có khả năng tận dụng các công cụ này, bởi các mô hình AI hiện tại vẫn xử lý các ngôn ngữ ít dữ liệu (không phải tiếng Anh) một cách kém hiệu quả.
Vấn đề không chỉ nằm ở dữ liệu, mà còn nằm ở cách AI “nghĩ”. Phần lớn các mô hình hiện nay được huấn luyện trên kho dữ liệu khổng lồ bằng tiếng Anh. Khi gặp một ngôn ngữ khác, các mô hình thường “dịch ngược” về tiếng Anh để xử lý, rồi mới trả lời lại. Quy trình hai bước ấy nghe có vẻ hợp lý, nhưng thực chất lại mở ra thêm nhiều tầng sai lệch.
Ngay cả ở cấp độ kỹ thuật sâu hơn, sự thiên lệch cũng đã được “lập trình” từ đầu. Các mô hình xử lý văn bản bằng cách chia nhỏ thành “token” — những đơn vị ngôn ngữ cơ bản. Vì được huấn luyện chủ yếu bằng tiếng Anh, chúng phân mảnh các ngôn ngữ khác kém hiệu quả hơn. Cùng một câu có thể cần nhiều token hơn gấp nhiều lần ở ngôn ngữ khác… khiến chi phí tăng lên đáng kể. Điều đó có nghĩa là không chỉ kém chính xác hơn, người dùng ở các ngôn ngữ khác còn phải trả giá đắt hơn - theo cả nghĩa đen lẫn nghĩa bóng.
Một phản ứng tự nhiên là “trộn” thêm tiếng Anh vào câu hỏi, hy vọng AI sẽ hiểu rõ hơn, song điều này lại phản tác dụng. Theo nghiên cứu, việc trộn nhiều ngôn ngữ trong cùng một câu hỏi… thường làm hiệu suất giảm thêm. Thay vì giúp mô hình bám vào điểm tựa, hệ thống rơi vào trạng thái nhiễu loạn giữa các ngôn ngữ.
Điều đáng suy ngẫm không chỉ là AI chưa hoàn hảo, mà là con người đang quá nhanh chóng tin vào sự hoàn hảo ấy. Khi một công nghệ được triển khai ở quy mô toàn cầu, mọi sai lệch nhỏ đều có thể nhân lên thành hệ quả lớn. Một câu trả lời sai trong tiếng Anh có thể được kiểm chứng lại, nhưng một câu trả lời sai trong một ngôn ngữ ít phổ biến có thể không bao giờ bị phát hiện.
Mặc dù vậy, vẫn có những tín hiệu tích cực. Chỉ cần bổ sung một lượng nhỏ dữ liệu chất lượng cao bằng ngôn ngữ địa phương, hiệu suất của mô hình đã có thể cải thiện đáng kể. Nhưng đó mới chỉ là bước đầu. Điều cần thiết hơn là một cách tiếp cận công bằng ngay từ gốc: xây dựng AI không chỉ “biết nhiều”, mà còn “hiểu đều các ngôn ngữ”. Nếu không, trí tuệ nhân tạo thay vì thu hẹp khoảng cách tri thức, lại có nguy cơ đào sâu thêm những bất bình đẳng vốn đã tồn tại. Khi đó, câu hỏi không còn là AI thông minh đến đâu, mà là: AI đang phục vụ ai.
- Từ khóa :
- chuyển đổi số
- công nghệ số
- AI
- trí tuệ nhân tạo
Tin liên quan
-
Công nghệ
Nâng cao năng lực chuyển đổi số cho lãnh đạo, quản lý và công chức
06:00' - 23/03/2026
Nếu không lấy người dân làm trung tâm, các nền tảng, giải pháp số rất dễ trở nên hình thức, kém hiệu quả, thậm chí làm gia tăng khoảng cách số giữa người dân và chính quyền.
-
Kinh tế xã hội
Drone và công nghệ số giúp nông dân Đồng Tháp tăng lợi nhuận
09:16' - 15/03/2026
Nhiều hợp tác xã ở tỉnh Đồng Tháp đang mạnh dạn ứng dụng khoa học, công nghệ và chuyển đổi số vào quản lý, sản xuất và tiêu thụ sản phẩm.
-
Công nghệ
Chuyển đổi số và AI đang làm thay đổi hệ sinh thái của ngành Dược
13:00' - 07/03/2026
Để tận dụng hiệu quả cơ hội từ chuyển đổi số, các chuyên gia cho rằng ngành Dược cần xây dựng hệ sinh thái hợp tác chặt chẽ giữa trường đại học, viện nghiên cứu, doanh nghiệp dược phẩm và cơ sở y tế.
-
Công nghệ
Phát triển thị trường lao động gắn với chuyển đổi số
06:00' - 07/03/2026
Hà Nội sẽ triển khai đồng bộ nhiều nhóm giải pháp trọng tâm, trong đó đặc biệt ưu tiên đào tạo, bồi dưỡng các kỹ năng mới có nhu cầu cao phục vụ kinh tế xanh và chuyển đổi số.
-
Công nghệ
Tháng Thanh niên 2026: Tuổi trẻ tiên phong chuyển đổi số
14:11' - 01/03/2026
Ngày 28/2, Thành đoàn Hải Phòng tổ chức Lễ khởi động Tháng Thanh niên năm 2026 và Tỉnh Đoàn Vĩnh Long cũng đã tổ chức Lễ ra quân Tháng Thanh niên năm 2026.
Tin cùng chuyên mục
-
Công nghệ
Trung Quốc “khát” nhân tài giữa làn sóng công nghệ bùng nổ
15:20'
Trung Quốc đang đẩy mạnh đào tạo và mở thêm nhiều ngành học mới nhằm giải quyết tình trạng thiếu hụt nhân lực AI khi nhu cầu tuyển dụng lĩnh vực này tăng mạnh.
-
Công nghệ
Chuyển đổi số tại các di tích đưa lịch sử đến gần hơn với giới trẻ
13:00'
Tại Hà Tĩnh, cuộc cách mạng số đang thổi một luồng sinh khí mới vào các “địa chỉ đỏ”, biến những tư liệu lịch sử vốn được coi là khô khan trở nên sinh động và gần gũi.
-
Công nghệ
Bộ xét nghiệm máu mới giúp phát hiện sớm bệnh Alzheimer
07:30'
Ông Matt Sause, Giám đốc điều hành mảng Chẩn đoán của Roche, khẳng định việc ra mắt bộ xét nghiệm Elecsys pTau217 là một bước tiến quan trọng trong việc rút ngắn thời gian chẩn đoán bệnh.
-
Công nghệ
Công nghệ thu hồi và lưu trữ carbon giúp giảm phát thải
17:55' - 12/05/2026
Thay vì xả phát thải CO2 vào khí quyển, công nghệ thu giữ amin hoặc hấp thụ vật lý cho phép làm sạch CO2 để phục vụ cho ngành thực phẩm hoặc tái tổng hợp thành cồn công nghiệp methanol, phân đạm ure.
-
Công nghệ
Xây dựng niềm tin số tài chính trong kỷ nguyên AI
13:00' - 12/05/2026
Trong kỷ nguyên AI (trí tuệ nhân tạo), vấn đề niềm tin đang đứng trước những thách thức hoàn toàn mới.
-
Công nghệ
Khi AI tiếp quản văn phòng
10:12' - 12/05/2026
Trí tuệ nhân tạo (AI) đang thay đổi thị trường lao động toàn cầu, nhưng không phải theo cách đồng đều.
-
Công nghệ
Trung Quốc đạt đột phá về siêu pin cho UAV
07:30' - 12/05/2026
Pin lithium-lưu huỳnh được coi là một giải pháp thay thế đầy triển vọng do mật độ năng lượng cao về mặt lý thuyết, cùng với sự dồi dào và giá thành thấp của lưu huỳnh.
-
Công nghệ
OpenAI công bố loạt tính năng AI giọng nói mới
16:30' - 11/05/2026
Điểm nhấn đáng chú ý nhất là mô hình GPT Realtime 2 — thế hệ AI giọng nói mới được xây dựng trên nền tảng suy luận cấp GPT-5.
-
Công nghệ
Khi robot làm chủ phòng thí nghiệm
13:00' - 11/05/2026
Robot Maholo hiện đã được triển khai tại một bệnh viện chuyên về nhãn khoa ở thành phố Kobe, miền Tây Nhật Bản, phục vụ nghiên cứu lâm sàng liên quan đến tế bào gốc đa năng cảm ứng (iPS).

Trí tuệ nhân tạo ngày càng hiện diện ở nhiều lĩnh vực. Ảnh minh hoạ