AI

Chatgpt(실험모델) 2025년 IMO(국제수학올림피아드) 금메달 획득

Optimization
728x90

IMO는 국제수학올림피아드의 약자로, 20살 이하의 학생이 참가하는 대회입니다.

 

올해 IMO는 최연소 금메달 수상자가 한국에서 나왔기에 더욱 의미가 있었습니다.

 

그런데 Chatgpt의 실험모델도 자체 테스트 결과 금메달이 나왔다고 합니다.

 

이 트윗을 쓴 사람은 OpenAI의 머신러닝 부분을 담당하고 있습니다.
이 트윗을 쓴 사람은 OpenAI의 머신러닝 부분을 담당하고 있습니다.

 

 

https://x.com/alexwei_/status/1946477742855532918

 

X의 Alexander Wei님(@alexwei_)

1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).

x.com

 

트윗 주소

 

https://github.com/aw31/openai-imo-2025-proofs

 

GitHub - aw31/openai-imo-2025-proofs

Contribute to aw31/openai-imo-2025-proofs development by creating an account on GitHub.

github.com

실험모델의 IMO답안(깃허브)

 

 

AI가 수학문제를 풀 수 있냐 없냐는 상당히 중요한 문제입니다. 왜냐하면 AI가 인간보다 뛰어난 이성을 갖추었음을 확인할 수 있는 강력한 증거가 되기 때문입니다. 코딩분야도 마찬가지로 문제해결력의 측면에서 충분히 객관적인 증거를 제시해줍니다.

 

인문학에서는 AI가 아무리 뛰어나도, 인문학 특성상 AI의 답변을 무조건 환각으로 받아들일 가능성이 있기 때문에 AI 발전의 증거로 보기 힘든 것이 현실입니다. 예를 들어 AI가 이해하지 못할 이야기를 하면, 이를 검토하기 보다는 AI에 문제가 있다고 생각할 것입니다. 하지만 수학은 '증명'으로, 과학은 '반증'으로, 코딩은 '실행'을 통해 AI의 결과물을 충분히 검증할 수 있습니다.

 

사실 oai의 o3나 o4-mini-high는 수능 수학 1등급을 고정적으로 받을 만큼 뛰어난 수학적 역량을 보여왔던 상황이었습니다. 하지만 이는 숫자를 찾는 단순한 문제에 불과하다는 지적도 뒤따라왔습니다. 수학적 증명같은 '진짜 수학' 영역에서는 약한 모습을 보여주었기 때문입니다. 그리고 답과 풀이를 외워서 답변한다는 엉뚱한 오해도 있었습니다.

 

따라서 이번 IMO 금메달은 AI가 진정한 수학적 역량을 갖추었음을 알 수 있는 계기가 될 것입니다. 물론 더 높은 수준의 대회가 많이 남아있는 만큼 갈길이 먼 것도 사실입니다.

 

만약 AI가 모든 인간보다 수학을 어떻게 될까요? 인간의 이성에 대한 새로운 접근이나 관점이 필요할 것입니다. 인간과 인공지능은 결코 동일한 방식으로 사고하지 않는다는 것이 지배적인 생각이고, 인공지능의 사고가 더 뛰어나다면 인간이라는 종이 갖는 특별함이 바래질 것입니다. 그리고 그 순간이 매순간 빠르게 다가오고 있습니다.