Qwen3-235B-A22B-2507(thinking)후기

Optimization

728x90

2025.07.23 - [AI] - qwen과 gemini중 어느 쪽의 딥리서치가 더 좋을까?

qwen과 gemini중 어느 쪽의 딥리서치가 더 좋을까?

https://chat.qwen.ai/ Qwen ChatCurrent System does not Support Qwen is actively working to ensure compatibility with the current system.chat.qwen.ai qwen이 최근에 대대적인 업데이트를 진행했습니다. Qwen3-235B-A22B-2507모델입니다. 벤

gradientdescent.tistory.com

예전에 최신 qwen3의 성능에 대해 설명해 드렸습니다. 저 글을 쓸 당시에는 '깊은 사고'기능이 활성화 되지 않았었는데, 최근에 '깊은 사고'기능이 업데이트 되었습니다.

위 순서에 따라 누르시면, 깊은 사고를 활성화 할 수 있습니다. 깊은 사고의 성능 제대로 느끼기 위해서는 그에 맞는 수학문제가 필요합니다.

저는 이 문제를 활용하려고 합니다. kmo에 출제된 문제입니다. open ai의 o4-mini-high와 비교해보도록 하겠습니다.

1. Qwen3-235B-A22B-2507(thinking)

qwen풀이의 문제점은 문제 풀이를 일일이 대입해서 패턴을 찾으려고 했다는 것입니다. 물론 해결법에는 패턴찾기도 있지만, 풀이를 완성할때는 이 패턴이 성립하는 이유를 수학적으로 논증하는 것이 맞을 것 입니다.

2. o4-mini-high

o4-mini-high는 상당히 비범한 풀이를 보여주었습니다. 부족한 부분을 찾을 수 없습니다.

3.결론

qwen의 수학 역량이 크게 발전한 것은 맞지만, 최상위권이라고 보기에는 아직 무리인듯 합니다.

'AI' 카테고리의 다른 글

문해력은 AI로 해결하자 (0)	2025.08.01
perplexity의 새로운 에이전트 - comet (2)	2025.07.31
qwen과 gemini중 어느 쪽의 딥리서치가 더 좋을까? (0)	2025.07.23
AI로 공문서 쓰는 요령 (0)	2025.07.22
chatgpt는 IMO를 풀때 메타인지를 발휘했다? (0)	2025.07.22

현재글Qwen3-235B-A22B-2507(thinking)후기

AI 설명해주는 남자