DeepSeek phát triển mô hình AI lập luận toán học có khả năng tự kiểm chứng
Ngày 28/11, công ty trí tuệ nhân tạo (AI) DeepSeek của Trung Quốc công bố mô hình AI DeepSeekMath-V2, được đánh giá là bước tiến đột phá trong lĩnh vực suy luận toán học của AI, thiết lập chuẩn hiệu suất mới và mở rộng giới hạn năng lực giải quyết vấn đề bằng máy học.
DeepSeekMath-V2 được công khai mã nguồn trên hai nền tảng Hugging Face và GitHub. Mô hình tích hợp một khung tự xác minh nhằm kiểm tra tính hợp lý của chuỗi lập luận, bên cạnh việc tạo ra đáp án chính xác, điều mà nhiều mô hình AI hiện nay vẫn gặp hạn chế.
Kết quả đánh giá cho thấy DeepSeekMath-V2 đạt mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và Olympic Toán học Trung Quốc (CMO) 2024. Đặc biệt, mô hình đạt 118/120 điểm trong kỳ thi Putnam 2024, vượt xa mức 90 điểm, kỷ lục cao nhất từng được con người thực hiện.
Năng lực suy luận logic của mô hình được kiểm tra bằng hệ thống IMO-ProofBench, bộ đánh giá chuyên dụng dùng để xác minh độ chính xác lập luận của các mô hình AI. DeepSeekMath-V2 thể hiện hiệu suất vượt trội so với nhiều mô hình tiên tiến khác, bao gồm DeepThink của DeepMind.
IMO-ProofBench vận hành theo cơ chế kiểm tra chéo: một mô hình đảm nhiệm vai trò “chứng minh”, tạo ra chuỗi lập luận toán học, trong khi mô hình còn lại giữ vai trò “thẩm định”, đánh giá mức độ chặt chẽ của lập luận. Cơ chế này cho phép phát hiện sai sót trong tư duy của mô hình, điểm yếu cố hữu của các hệ thống AI đương đại.
Theo nhóm phát triển, phương pháp tự kiểm chứng của DeepSeekMath-V2 giúp giải quyết hạn chế lớn nhất của các mô hình AI hiện nay: khả năng tạo ra câu trả lời đúng nhưng dựa trên lập luận sai hoặc không nhất quán.
DeepSeek nhận định những tiến bộ này cho thấy hướng tiếp cận "suy luận toán học tự xác minh" có tiềm năng trở thành nền tảng cốt lõi cho thế hệ AI toán học mạnh mẽ, đáng tin cậy và minh bạch hơn trong tương lai.
- Từ khóa :
- chuyển đổi số
- công nghệ số
Tin liên quan
-
Công nghệ
Ứng dụng AI và công nghệ số trong chăm sóc sức khỏe
13:30' - 27/11/2025
Ứng dụng trí tuệ nhân tạo (AI) và công nghệ số trong chăm sóc sức khỏe toàn trình khép kín tại nhà đến nhà thuốc, bệnh viện đang được các tập đoàn công nghệ Việt Nam triển khai hiệu quả.
-
Công nghệ
Ứng dụng công nghệ số nâng cao hiệu quả phối hợp trong giai đoạn mới
13:30' - 09/11/2025
Các đại biểu cho rằng, giai đoạn tới, việc ứng dụng công nghệ số và xây dựng cơ sở dữ liệu chung là giải pháp then chốt để đổi mới phương thức phối hợp, giúp kết nối nhanh, chính xác giữa các tổ chức.
-
Công nghệ
Việt Nam phát triển và làm chủ công nghệ số dựa trên chuẩn mở
21:26' - 03/11/2025
Chiều 3/11, Bộ Khoa học và Công nghệ tổ chức Diễn đàn Công nghệ mở năm 2025 tại Hà Nội.
-
Công nghệ
Ứng dụng công nghệ số để khám sàng lọc bệnh tim mạch, thận người dân
13:30' - 29/10/2025
Thành phố Huế là địa phương có nền tảng y học, khoa học công nghệ mạnh và có thể trở thành hình mẫu về y tế thông minh.
-
Công nghệ
Đào tạo kỹ năng ứng dụng công nghệ số, mô hình kinh doanh xanh cho nữ doanh nhân
15:30' - 26/08/2025
Tham gia khóa đào tạo, các nữ doanh nhân được cung cấp những kiến thức, kỹ năng thông qua chuyên đề xu hướng chuyển dịch xanh, yêu cầu nâng cao năng lực xanh đối với doanh nghiệp.
Tin cùng chuyên mục
-
Công nghệ
Bất ngờ đến từ robot đánh bóng bàn của Sony AI
16:30' - 24/04/2026
Robot này có tên gọi là Ace, dù sở hữu ngoại hình khá cồng kềnh với kích thước tương đương một chiếc bàn bóng bàn, nhưng thiết bị này có khả năng đưa ra quyết định trong tích tắc.
-
Công nghệ
Bombardier ứng dụng AI vào thiết kế máy bay phản lực
13:00' - 24/04/2026
Bombardier cho biết việc tích hợp AI tiên tiến sẽ giúp cải thiện khả năng cung cấp các máy bay phản lực thương mại đẳng cấp thế giới cho khách hàng.
-
Công nghệ
TSMC sẽ bắt đầu sản xuất chip 1,3 nanomet vào năm 2029
07:30' - 24/04/2026
Tập đoàn TSMC, nhà sản xuất chip theo hợp đồng lớn nhất thế giới, ngày 23/4 thông báo sẽ bắt đầu sản xuất chip 1,3 nanomet tiên tiến bằng quy trình chế tạo mới vào năm 2029.
-
Công nghệ
Ứng dụng dữ liệu số trong quản lý hoạt động Đoàn
13:00' - 23/04/2026
Nhằm giảm áp lực báo cáo đối với các cơ sở Đoàn, Thành đoàn Thành phố Hồ Chí Minh tiếp tục hoàn thiện các công cụ quản lý, từng bước áp dụng chấm điểm, xếp loại dựa trên dữ liệu số.
-
Công nghệ
Microsoft công bố đầu tư kỷ lục 17,9 tỷ USD vào hạ tầng AI tại Australia
12:56' - 23/04/2026
Khoản đầu tư nhằm mở rộng hệ thống siêu máy tính AI và hạ tầng điện toán đám mây, đồng thời tăng cường năng lực an ninh mạng và khả năng ứng phó rủi ro của quốc gia.
-
Công nghệ
EU quy định pin tháo rời cho thiết bị di động từ năm 2027
08:00' - 23/04/2026
Điện thoại thông minh và máy tính bảng mới được đưa ra thị trường EU kể từ thời điểm trên phải được trang bị pin có thể tháo rời và thay thế bởi người dùng mà không cần đến công cụ chuyên dụng.
-
Công nghệ
“Cha đẻ AI” cảnh báo rủi ro khi công nghệ thiếu kiểm soát
05:30' - 23/04/2026
Trí tuệ nhân tạo (AI) nếu không được kiểm soát có thể giống như một chiếc xe tăng tốc mà không có phanh.
-
Công nghệ
Robot tích hợp AI - hy vọng mới cho công nghiệp Đức
22:00' - 22/04/2026
Sự xuất hiện của các robot hình người tích hợp "trí tuệ nhân tạo (AI) vật lý" đang thắp lên hy vọng vực dậy ngành sản xuất vốn đang đối mặt nhiều khó khăn của Đức.
-
Công nghệ
SpaceX hợp tác với Cursor AI trong cuộc đua trí tuệ nhân tạo
13:00' - 22/04/2026
SpaceX hiện là công ty dẫn đầu thị trường phóng vệ tinh với các tên lửa tái sử dụng, đồng thời sở hữu mạng lưới vệ tinh lớn nhất thế giới Starlink.

Biểu tượng của Deepseek. Ảnh: REUTERS/TTXVN