AI

Google Deep Mind의 IMO 금메달

Optimization
728x90

구글 딥마인드, 제미나이(Gemini)로 IMO 금메달 획득

 

OpenAI에 이어 구글 딥마인드의 제미나이(Gemini)도 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 달성했습니다. 이 글에서는 두 AI의 성과와 풀이 방식의 차이점, 그리고 IMO를 둘러싼 논란을 살펴봅니다.

 

지난 글(2025.07.19 - [AI] - Chatgpt(실험모델) 2025년 IMO(국제수학올림피아드) 금메달 획득)에서 OpenAI(ChatGPT)의 IMO 금메달 소식을 전달드렸습니다. 이번에는 딥마인드의 IMO 금메달 소식을 전달드리도록 하겠습니다.

 

1. OpenAI 발표와 IMO의 엇갈린 반응

 

OpenAI의 IMO 금메달 소식 이후, 구글 딥마인드는 의미심장한 트윗을 남겼습니다.

 

구글 딥마인드 직원의 의미심장한 트윗 'We were there too. Just saying.'
7월 19일에, 구글 딥마인드의 직원은 의미심장한 트윗을 남깁니다.

 

7월 19일 날짜로 올라온 이 트윗으로 미루어 보았을 때, 딥마인드도 IMO에 참가했음을 짐작할 수 있습니다.

 

IMO 측의 OpenAI 발표에 대한 비판적인 입장문 캡처
IMO쪽에서는 OAI의 성급한 발표에 불쾌함을 표시하였습니다.

 


번역:
IMO 2025 폐막식 파티에서 IMO 사무총장 리아 판 후펠과 OpenAI의 발표에 대해 이야기를 나눴습니다. 제가 이사회나 IMO를 대변해서 말할 수는 없습니다. (또한 IMO 회장인 그레고르 돌리나르와는 이 문제에 대해 이야기할 기회가 없었고, 이사회도 귀국 중이라 앞으로 며칠 동안은 회의를 열기 어려운 상황일 겁니다.) 하지만 리아는 IMO 2025의 심사위원단과 채점위원들의 전반적인 의견은, AI 개발자들이 (이번 경우처럼 폐막식 이전에) 자신들의 IMO 성과를 대회와 너무 가까운 시점에 발표하는 것은 무례하고 부적절하다는 것이라고 전해도 좋다고 했습니다. 채점위원들의 일반적인 견해는, 본래 실제 인간 IMO 참가자들의 성과에 집중해야 할 시기이므로 그러한 발표는 폐막식 후 최소 일주일은 기다려야 한다는 것입니다. AI 관련 발표는 이로부터 주의를 분산시키는 역할만 할 뿐입니다.

제 생각에 oai는 자신들의 모델을 테스트하는 데 IMO와 협력하기로 동의한 AI 회사 중 하나가 아니었던 것 같습니다. 또한 선샤인 코스트에 있던 91명의 채점위원 중 누구도 그들의 답안지를 평가하는 데 관여하지 않았다고 생각합니다.


IMO 측에서는 oai가 너무 성급하게 금메달 소식을 밝혔다고 하며 아쉬움을 밝혔는데, oai는 발표 시기와 관련해 어떠한 연락도 받지 못했다고 트윗을 남긴 상태입니다. 결론적으로 IMO의 실수라고 할 수 있는데, 학생들만 아쉬울 따름입니다.

 

2. 구글 딥마인드의 공식 발표: 제미나이도 금메달

 

이렇게 어수선한 상황이 이어지던 도중 딥마인드에서 충격적인 소식을 전달합니다.

 

구글 딥마인드의 제미나이 IMO 금메달 획득 발표 트윗

 

https://x.com/GoogleDeepMind/status/1947333836594946337

 

X의 Google DeepMind님(@GoogleDeepMind)

An advanced version of Gemini with Deep Think has officially achieved gold medal-level performance at the International Mathematical Olympiad. 🥇 It solved 5️⃣ out of 6️⃣ exceptionally difficult problems, involving algebra, combinatorics, geometr

x.com

 

딥마인드의 제미나이 역시 수학 올림피아드에서 금메달을 획득한 것입니다. OpenAI와 동일하게 6번째 문제를 풀지 못하였고 동점이었습니다.

 

3. GPT-4o vs 제미나이: 풀이의 질적 차이

 

OpenAI와 차별화되는 점은 풀이 작성인데, OpenAI의 풀이는 문법이 엉망이고 지나치게 함축적인데 반해, 제미나이의 풀이는 상당히 상세하였습니다.

https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf

 

 

왼쪽 제미나이, 오른쪽 GPT의 수학 문제 풀이 비교 스크린샷
왼쪽 사진은 gemini의 풀이, 오른쪽 사진은 gpt의 풀이입니다.

 

언뜻 보았을 때도 gemini 쪽이 훨씬 정교하게 작성되었음을 알 수 있었습니다. 이러한 차이는 사실 비하인드가 있는데, gpt 같은 경우는 수학문제 풀이에 대한 AI 학습의 새로운 방법론이 최근에 나왔기 때문에, 풀이 과정을 정교하게 작성할만한 여유가 없었던 것입니다. 그에 비해 딥마인드 쪽은 이미 예전부터 갈피를 잡은 것으로 보입니다.

 


 

OpenAI에 이어 딥마인드까지 올림피아드 금메달을 획득하였고, 이로써 AI의 수학적 사고에 대한 실마리가 어느 정도 풀렸다고 할 수 있습니다. 새로운 시대의 새로운 도구로 우리는 어떤 지적인 세계를 엿볼 수 있을까요? 많은 기대가 됩니다.