Lộ diện 'thần đồng' AI đạt điểm tuyệt đối 4 bài Toán Olympic quốc tế, có bài chỉ 'xử nhanh' trong 19 giây

AlphaProof đã chứng tỏ năng lực của mình khi vượt qua những câu hỏi của kỳ thi Olympic Toán năm nay một cách xuất sắc.

Sau khi đánh bại con người ở môn cờ vây, Google DeepMind đã tuyên bố họ sắp  "vượt mặt" những học sinh giỏi Toán nhất thế giới.

Theo đó, mới đây, họ công bố các hệ thống trí tuệ nhân tạo (AI) đã giải được 4 trong số 6 bài toán trong kỳ thi Olympic Toán học Quốc tế (IMO) năm 2024. AI đã đưa ra các bước giải vô cùng hợp lý và được chấm điểm bởi GS Timothy Gowers của Đại học Cambridge (Anh) - người từng giành huy chương vàng IMO và huy chương Fields (năm 1998); TS Joseph Myers, chủ tịch hội đồng ra đề IMO năm nay. Hai nhà Toán học đã chấm 28/42 điểm, chỉ kém một điểm so với phạm vi huy chương vàng.

Các bài toán được đưa ra tại Kỳ thi Olympic Toán học Quốc tế thuộc nhiều lĩnh vực toán học. Ảnh: David Wong/South China Morning Post/Getty

AI đã được thử thách giải các câu hỏi về đại số, tổ hợp, lý thuyết số và một bài hình học. Tuy nhiên, AI đã giải xong 4 bài, riêng phần tổ hợp không giải được. Trong đó, bài hình học được đánh giá khó hơn nhưng AI chỉ mất 19 giây để giải xong bài toán. “Rõ ràng đây là một bước tiến rất đáng kể”, Joseph Myers nói.

AlphaProof là dự án nghiên cứu thuộc Google Deepmind, bộ phận nghiên cứu trí tuệ nhân tạo (AI) của Google. Nó là sự kết hợp giữa mô hình ngôn ngữ với kỹ thuật, sử dụng công cụ AlphaZero - trước đây đã được sử dụng để làm kiểm soát các trò chơi cờ vua, cờ tướng và cờ vây.

Các phương pháp tiếp cận dựa trên ngôn ngữ tự nhiên có thể khiến các bước suy luận và giải pháp không chính xác mặc dù có quyền truy cập nhiều dữ liệu hơn. Vì thế, các nhà khoa học đã thiết lập cầu nối bằng cách tinh chỉnh mô hình Gemini - mô hình ngôn ngữ lớn tự nhiên, được dùng làm kho dữ liệu đầu vào về các bài toán, cách chứng minh đã công bố và những kiến thức liên quan.

Khi gặp vấn đề, AlphaProof tạo ra các ứng viên giải pháp và sau đó chứng minh hoặc bác bỏ chúng bằng cách tìm kiếm qua các bước chứng minh có thể có trong Lean. Mỗi bằng chứng được tìm thấy và xác minh được sử dụng để củng cố mô hình ngôn ngữ của AlphaProof, nâng cao khả năng giải quyết các vấn đề tiếp theo, khó khăn hơn.

Nguồn: Google Deepmind

TIN LIÊN QUAN