Cả Google DeepMind và OpenAI vừa công bố các mô hình AI của họ đã đạt số điểm tương đương với huy chương vàng tại Olympic Toán quốc tế 2025, tổ chức tại thành phố Sunshine Coast (Australia). Đây là kỳ tích chưa từng có, khi AI vượt qua ngưỡng thử thách tư duy hàng đầu vốn dành cho học sinh giỏi Toán trên toàn thế giới.
Các mô hình AI của Google và OpenAI đều giải đúng 5/6 bài thi IMO một thành tích đủ để giành huy chương vàng. Điểm đặc biệt là cả hai hệ thống đều sử dụng phương pháp lý luận thông qua ngôn ngữ tự nhiên thay vì các công cụ toán học chuyên biệt, đánh dấu bước chuyển mình rõ rệt trong cách AI "suy nghĩ".

Google DeepMind, hợp tác cùng ban tổ chức IMO, đã đưa mô hình Gemini Deep Think phiên bản nâng cấp từ hội nghị nhà phát triển Google I/O 2025 vào thử nghiệm chính thức. Theo Google, mô hình đã giải các đề thi trong giới hạn thời gian 4,5 giờ, tương tự thí sinh thật, và được ban giám khảo IMO xác nhận kết quả.
OpenAI dù không tham gia trực tiếp nhưng cũng công bố một mô hình thử nghiệm đạt kết quả tương đương. Ba cựu huy chương vàng IMO độc lập xác minh và xác nhận độ chính xác của lời giải. Mô hình này sử dụng kỹ thuật "tư duy kéo dài", cho phép hệ thống tính toán song song và phát triển các luồng suy luận sâu rộng hơn.
Noam Brown kỹ sư tại OpenAI nhận định: "Các bài toán IMO yêu cầu tư duy sáng tạo và bền bỉ, vượt xa khả năng tính toán đơn thuần. Việc AI có thể giải quyết được cho thấy khả năng mở rộng của công nghệ này".
Trong khi đó, giáo sư toán học Junehyuk Jung (Đại học Brown, Mỹ), đồng thời là nhà nghiên cứu tại DeepMind, cho rằng: "Khi AI hiểu và giải quyết bài toán bằng ngôn ngữ tự nhiên, chúng ta có thể chứng kiến sự hợp tác thực sự giữa máy móc và nhà toán học".
Theo Reuters, đột phá này có thể mở ra tương lai nơi AI trở thành trợ lý đắc lực trong việc giải quyết các bài toán mở chưa có lời giải, không chỉ trong toán học mà cả vật lý, khoa học máy tính và các lĩnh vực kỹ thuật cao.
Olympic Toán quốc tế 2025 diễn ra từ 10-20/7 với 630 thí sinh đến từ khắp thế giới. Trong đó, chỉ 67 học sinh (tương đương 11%) đạt huy chương vàng. Việc các mô hình AI đạt thành tích tương đương đã khiến cộng đồng học thuật lẫn công nghệ sửng sốt.
Ban giám khảo IMO xác nhận kết quả chính thức của các hệ thống AI tham gia thử nghiệm từ các đối tác công nghệ như Google. Theo yêu cầu, mọi công bố đều được thực hiện sau khi học sinh nhận giải và các chuyên gia độc lập xác minh lời giải.
Trong khi đó, OpenAI đã công bố kết quả sớm hơn sau lễ bế mạc hôm 19/7, với sự đồng thuận của một thành viên ban giám khảo IMO.