BNEWS Trong vài năm qua, trí tuệ nhân tạo (AI) đã bước ra khỏi phòng thí nghiệm để đi vào đời sống, từ lớp học, văn phòng cho đến phòng khám.
Những mô hình ngôn ngữ lớn (LLM) được ca ngợi như những “bộ não biết nói”, có thể tư vấn, phân tích, thậm chí hỗ trợ con người ra quyết định.
Nhưng đằng sau vẻ trơn tru ấy, có một khoảng trống âm thầm: AI không "giỏi" mọi ngôn ngữ và tiếng Anh luôn chiếm ưu thế. Đôi khi, sự thiếu công bằng đó không chỉ là vấn đề kỹ thuật mà là vấn đề sinh tử. Hãy hình dung một câu hỏi tưởng chừng đơn giản: một phụ nữ mang thai bị phù chân vào cuối thai kỳ nên làm gì? Với người hỏi bằng tiếng Anh, câu trả lời của AI có thể rất chuẩn xác: cần cảnh giác với tiền sản giật, một biến chứng nguy hiểm. Nhưng với người hỏi bằng một ngôn ngữ khác, tiếng Swahili (ngôn ngữ phổ biến ở khu vực Đông Phi) chẳng hạn, câu trả lời lại có thể là: “Bạn không cần lo lắng”.
Phóng viên TTXVN tại London dẫn kết quả của một nghiên cứu mới đây cho thấy độ chính xác của mô hình ở những ngôn ngữ ngoài tiếng Anh có thể thấp hơn tới gần 30 điểm phần trăm. Trong trường hợp tệ nhất, một mô hình có thể trả lời đúng khoảng 75% câu hỏi bằng tiếng Anh lại chỉ đạt 22,6% ở ngôn ngữ khác. Một sự chênh lệch như vậy, nếu xảy ra trong lĩnh vực y tế hay pháp lý, không còn là lỗi công nghệ, mà là rủi ro xã hội.
Điều đáng nói là thế giới không vận hành bằng một ngôn ngữ duy nhất. Khi các tổ chức quốc tế bắt đầu triển khai AI ở những khu vực đang phát triển – từ châu Phi đến Đông Nam Á – những cộng đồng không nói tiếng Anh lại là những đối tượng được kỳ vọng sẽ hưởng lợi nhiều nhất. Trớ trêu thay, đây lại là nhóm ít có khả năng tận dụng các công cụ này, bởi các mô hình AI hiện tại vẫn xử lý các ngôn ngữ ít dữ liệu (không phải tiếng Anh) một cách kém hiệu quả.
Vấn đề không chỉ nằm ở dữ liệu, mà còn nằm ở cách AI “nghĩ”. Phần lớn các mô hình hiện nay được huấn luyện trên kho dữ liệu khổng lồ bằng tiếng Anh. Khi gặp một ngôn ngữ khác, các mô hình thường “dịch ngược” về tiếng Anh để xử lý, rồi mới trả lời lại. Quy trình hai bước ấy nghe có vẻ hợp lý, nhưng thực chất lại mở ra thêm nhiều tầng sai lệch.
Ngay cả ở cấp độ kỹ thuật sâu hơn, sự thiên lệch cũng đã được “lập trình” từ đầu. Các mô hình xử lý văn bản bằng cách chia nhỏ thành “token” — những đơn vị ngôn ngữ cơ bản. Vì được huấn luyện chủ yếu bằng tiếng Anh, chúng phân mảnh các ngôn ngữ khác kém hiệu quả hơn. Cùng một câu có thể cần nhiều token hơn gấp nhiều lần ở ngôn ngữ khác… khiến chi phí tăng lên đáng kể. Điều đó có nghĩa là không chỉ kém chính xác hơn, người dùng ở các ngôn ngữ khác còn phải trả giá đắt hơn - theo cả nghĩa đen lẫn nghĩa bóng.
Một phản ứng tự nhiên là “trộn” thêm tiếng Anh vào câu hỏi, hy vọng AI sẽ hiểu rõ hơn, song điều này lại phản tác dụng. Theo nghiên cứu, việc trộn nhiều ngôn ngữ trong cùng một câu hỏi… thường làm hiệu suất giảm thêm. Thay vì giúp mô hình bám vào điểm tựa, hệ thống rơi vào trạng thái nhiễu loạn giữa các ngôn ngữ.
Điều đáng suy ngẫm không chỉ là AI chưa hoàn hảo, mà là con người đang quá nhanh chóng tin vào sự hoàn hảo ấy. Khi một công nghệ được triển khai ở quy mô toàn cầu, mọi sai lệch nhỏ đều có thể nhân lên thành hệ quả lớn. Một câu trả lời sai trong tiếng Anh có thể được kiểm chứng lại, nhưng một câu trả lời sai trong một ngôn ngữ ít phổ biến có thể không bao giờ bị phát hiện.
Mặc dù vậy, vẫn có những tín hiệu tích cực. Chỉ cần bổ sung một lượng nhỏ dữ liệu chất lượng cao bằng ngôn ngữ địa phương, hiệu suất của mô hình đã có thể cải thiện đáng kể. Nhưng đó mới chỉ là bước đầu. Điều cần thiết hơn là một cách tiếp cận công bằng ngay từ gốc: xây dựng AI không chỉ “biết nhiều”, mà còn “hiểu đều các ngôn ngữ”. Nếu không, trí tuệ nhân tạo thay vì thu hẹp khoảng cách tri thức, lại có nguy cơ đào sâu thêm những bất bình đẳng vốn đã tồn tại. Khi đó, câu hỏi không còn là AI thông minh đến đâu, mà là: AI đang phục vụ ai.
- Từ khóa:
- chuyển đổi số
- công nghệ số
- AI
- trí tuệ nhân tạo
Tin liên quan
Nâng cao năng lực chuyển đổi số cho lãnh đạo, quản lý và công chức
Nếu không lấy người dân làm trung tâm, các nền tảng, giải pháp số rất dễ trở nên hình thức, kém hiệu quả, thậm chí làm gia tăng khoảng cách số giữa người dân và chính quyền.
Tin cùng chuyên mục
-
Công nghệKỷ nguyên trí tuệ nhân tạo và bài toán cân bằng
Theo phóng viên TTXVN tại Tel Aviv, các chuyên gia và doanh nghiệp công nghệ Israel cho rằng trí tuệ nhân tạo (AI) đang tạo ra những thay đổi sâu sắc đối với thị trường lao động và nền kinh tế số.
-
Công nghệTận dụng AI phát hiện sớm cháy rừng bằng âm thanh
Trong bối cảnh mùa Hè bước vào cao điểm và nguy cơ cháy rừng gia tăng, một startup công nghệ Firewave đang phát triển giải pháp AI nhằm phát hiện hỏa hoạn ngay từ giai đoạn sớm nhất.
-
Công nghệỨng dụng y học số giúp nâng cao hiệu quả điều trị bệnh lý tim mạch
Các nghiên cứu mới nhất trên thế giới chỉ ra rằng, điều trị suy tim hiện nay cần được triển khai sớm, đầy đủ và có hệ thống; đồng thời quản lý người bệnh theo từng kiểu hình.
-
Công nghệCông nghệ làm mát đô thị để ứng phó nắng nóng cực đoan
Công nghệ này cho phép đẩy một phần năng lượng Mặt Trời trở lại khí quyển thay vì hấp thụ vào công trình, từ đó giảm nhu cầu sử dụng điều hòa và góp phần cắt giảm phát thải khí nhà kính.
-
Công nghệKhoác “áo số” cho di sản nghìn năm Tháp Bà Pô Nagar
Việc áp dụng công nghệ vào di tích không thuần túy là xu hướng kỹ thuật mà là phương thức diễn giải di sản mới, sinh động và bền vững hơn.
-
Công nghệThái Lan: “Tiếp sức số” cho nông dân
Theo kế hoạch, chương trình sẽ đào tạo miễn phí theo hình thức trực tiếp và trực tuyến cho ít nhất 2.000 nông dân và doanh nghiệp SMEs trong lĩnh vực nông nghiệp.
-
Công nghệĐấu giá tên miền .vn: Ok.vn đạt mức trả giá cao nhất 109 triệu đồng
Đợt 2 đấu giá cấp quyền sử dụng tên miền quốc gia Việt Nam “.vn” có độ dài 2 ký tự tiếp tục ghi nhận sự quan tâm tích cực của cộng đồng trong hai ngày 24 và 25/6.
-
Công nghệOpenAI cân nhắc hoãn IPO đến năm 2027
Theo báo cáo vừa công bố từ New York Times, OpenAI đang xem xét hoãn kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) cho đến năm 2027.
-
Công nghệHướng đi mới cho pin nhiên liệu hydro
Theo các nhà khoa học, công nghệ này có tiềm năng ứng dụng trong ô tô chạy bằng hydro, tàu hỏa, máy bay không người lái, tàu thủy, hệ thống điện phân tán.













