AI

chatgpt 유료구독을 해야하는 이유

Optimization
728x90

AI 모델별 검색 능력 비교: ChatGPT o3는 정말 뛰어날까? (vs Gemini, Perplexity)

이 글에서는 ChatGPT의 유료 모델 o3의 뛰어난 웹 검색 능력을 Gemini 2.5 Pro, Perplexity와 비교합니다. 특정 블로그 내 게시물을 찾는 과제를 통해 각 AI의 성능을 실증적으로 분석합니다.

 


들어가며: AI의 새로운 핵심 능력, '도구 사용'

ChatGPT의 유료 모델 중에는 'o3'라는 뛰어난 추론 능력을 갖춘 모델이 있습니다. 흔히 Gemini 2.5 Pro와 비교 대상이 되곤 하는데, o3의 진정한 강점은 바로 강력한 '도구 사용 능력'에 있습니다.

 

o3는 문제를 해결하기 위해 파이썬이나 검색 도구를 적극적으로 활용합니다. 코딩은 claude보다 떨어질 수 있지만, 파이썬을 활용해서 문제를 해결하는 능력은 결코 뒤지지 않습니다. 특히 '검색' 기능은 웬만한 다른 모델들 보다 훨씬 뛰어난 성능을 보여줍니다. 과연 그 성능이 어느 정도인지 직접 테스트해보았습니다.

 

테스트 과제: 특정 블로그에서 '탈옥' 관련 글 찾기

다음과 같은 과제를 각 AI 모델에게 부여했습니다.

과제: https://gradientdescent.tistory.com 블로그 글 중에 '탈옥'과 관련된 글을 찾아봐.

 

이 과제의 정답은 아래 게시물입니다.

 

chatgpt 탈옥에 관한 간단한 팁

Chatgpt를 포함한 여러 AI는 사용자에게 건전한 정보만을 제공하기위해 노력합니다. 하지만, 지나치게 사용자를 보호하려는 경향이 강해서 정작 얻어야할 정보를 얻지 못할때가 있습니다. 이럴때

gradientdescent.tistory.com

 


AI 모델별 검색 테스트 결과

1. Gemini 2.5 Pro

Gemini 2.5 Pro가 블로그 내 '탈옥' 관련 글을 찾지 못하고 실패한 결과 화면
Gemini 2.5 Pro는 아쉽게도 정답을 찾지 못했습니다.

Gemini 2.5 Pro는 아쉽게도 과제를 수행하지 못하고 관련 글을 찾지 못했습니다.

 

2. ChatGPT o3

ChatGPT o3가 단계별 검색 과정을 통해 '탈옥' 관련 글을 성공적으로 찾아내는 과정 1
ChatGPT o3의 검색 과정 (1)
ChatGPT o3가 단계별 검색 과정을 통해 '탈옥' 관련 글을 성공적으로 찾아내는 과정 2
ChatGPT o3의 검색 과정 (2)

반면 ChatGPT o3는 블로그를 꼼꼼하게 탐색하여 정확하게 정답을 찾아냈습니다. 또한, 어떤 과정을 거쳐 글을 찾았는지 그 과정을 상세하게 보여주어 신뢰도를 높였습니다.

 

3. Perplexity (Claude 3 Sonnet 기반)

Perplexity AI가 '탈옥' 관련 글을 빠르게 찾아내어 링크를 제시하는 결과 화면
검색 특화 AI 답게 Perplexity는 순식간에 정답을 찾아냈습니다.

검색 특화 서비스인 Perplexity는 역시나 가장 빠른 속도로 정확한 정답을 찾아냈습니다.

 


결론: 종합적으로 o3가 가장 낫다

단순 정보 검색에서는 Perplexity가 강력한 모습을 보여주었습니다. 하지만 Perplexity는 이전에 작성한 글(링크)에서 언급했듯이, 기반 AI 모델의 성능을 100% 활용하는 데에는 한계가 있습니다.

 

따라서 생활기록부 작성, 코딩, 창작 등 검색 이외의 복합적인 작업을 고려한다면, 강력한 도구 사용 능력과 추론 능력을 겸비한 ChatGPT o3가 현재로서는 더 현명한 선택이 될 수 있겠습니다.