AI 모델별 검색 능력 비교: ChatGPT o3는 정말 뛰어날까? (vs Gemini, Perplexity)
들어가며: AI의 새로운 핵심 능력, '도구 사용'
ChatGPT의 유료 모델 중에는 'o3'라는 뛰어난 추론 능력을 갖춘 모델이 있습니다. 흔히 Gemini 2.5 Pro와 비교 대상이 되곤 하는데, o3의 진정한 강점은 바로 강력한 '도구 사용 능력'에 있습니다.
o3는 문제를 해결하기 위해 파이썬이나 검색 도구를 적극적으로 활용합니다. 코딩은 claude보다 떨어질 수 있지만, 파이썬을 활용해서 문제를 해결하는 능력은 결코 뒤지지 않습니다. 특히 '검색' 기능은 웬만한 다른 모델들 보다 훨씬 뛰어난 성능을 보여줍니다. 과연 그 성능이 어느 정도인지 직접 테스트해보았습니다.
테스트 과제: 특정 블로그에서 '탈옥' 관련 글 찾기
다음과 같은 과제를 각 AI 모델에게 부여했습니다.
과제: https://gradientdescent.tistory.com 블로그 글 중에 '탈옥'과 관련된 글을 찾아봐.
이 과제의 정답은 아래 게시물입니다.
chatgpt 탈옥에 관한 간단한 팁
Chatgpt를 포함한 여러 AI는 사용자에게 건전한 정보만을 제공하기위해 노력합니다. 하지만, 지나치게 사용자를 보호하려는 경향이 강해서 정작 얻어야할 정보를 얻지 못할때가 있습니다. 이럴때
gradientdescent.tistory.com
AI 모델별 검색 테스트 결과
1. Gemini 2.5 Pro

Gemini 2.5 Pro는 아쉽게도 과제를 수행하지 못하고 관련 글을 찾지 못했습니다.
2. ChatGPT o3


반면 ChatGPT o3는 블로그를 꼼꼼하게 탐색하여 정확하게 정답을 찾아냈습니다. 또한, 어떤 과정을 거쳐 글을 찾았는지 그 과정을 상세하게 보여주어 신뢰도를 높였습니다.
3. Perplexity (Claude 3 Sonnet 기반)

검색 특화 서비스인 Perplexity는 역시나 가장 빠른 속도로 정확한 정답을 찾아냈습니다.
결론: 종합적으로 o3가 가장 낫다
단순 정보 검색에서는 Perplexity가 강력한 모습을 보여주었습니다. 하지만 Perplexity는 이전에 작성한 글(링크)에서 언급했듯이, 기반 AI 모델의 성능을 100% 활용하는 데에는 한계가 있습니다.
따라서 생활기록부 작성, 코딩, 창작 등 검색 이외의 복합적인 작업을 고려한다면, 강력한 도구 사용 능력과 추론 능력을 겸비한 ChatGPT o3가 현재로서는 더 현명한 선택이 될 수 있겠습니다.
'AI' 카테고리의 다른 글
| 한국형 AI는 어디까지 왔을까? - solar pro2 (3) | 2025.07.20 |
|---|---|
| gemini code assist후기 (아직 많이 멀었다) (0) | 2025.07.20 |
| Chatgpt(실험모델) 2025년 IMO(국제수학올림피아드) 금메달 획득 (1) | 2025.07.19 |
| AI의 지능을 측정하는 방법 - Arc agi (0) | 2025.07.19 |
| Gemini API 가이드: Structured Output으로 JSON 출력 형식 고정하기 (0) | 2025.07.19 |