메인

웹&PC

최신 AI 모델들 비교 [제미나이 2.5 Pro vs GPT o3 vs 클로드 3.7]

KEKEWO 2025. 4. 18. 02:03
반응형


요즘 AI 모델들 줄줄이 업데이트 됐다는 소식, 들으셨죠?

  • 제미나이 2.5 Pro
  • GPT o3
  • 클로드 3.7

이젠 슬슬 기대해볼만 하지 않겠습니까?
그래서! 같은 수능 문제로 다시 실험 돌려봤습니다. (정답은 "152"로 고정)

클로드 3.7

처음엔 꽤 잘하나 싶었어요.
4분 넘으니 "계속하기" 누르라 하고, 계산도 열심히 하더라고요?

그런데 결론은...

못 풀었다고 검색 다시 해본대요.

또 기다리니까

더 정확히 풀겠다며 다시 계산 돌리는데
또 토큰 초과로 "계속하기" 반복...

결국 이번에도 탈락.
시간 끌더니… 실패로 끝났습니다.

 

제미나이 2.5 Pro

요즘 제일 핫한 가성비 모델이죠?

속도는 괜찮았습니다. 꽤 빠르게 풀이 시작해서

"정답은 147입니다!"

...응? 아니야... 정답은 152거든?
틀렸습니다!
그래도 속도는 준수했으니까, 그건 인정.

반응형

그록

지난번에도 48분 돌려보다가 포기했는데, 이번에도 여전하더군요.
“생각 중...”만 띄워놓고 움직임 없음.
패스합니다.

딥시크

역시나 개선이 없어서 시간 엄청 걸렸고요.

결과는 역시 오답.
이쪽은 변화가 없네요. 아직 멀었음...

GPT o3 – 진짜 주인공 등장

마지막으로 GPT o3, 가장 최근에 나온 모델!

결과는?

  • 풀이 시작부터 끝까지 1분 18초
  • 정답: ✅ 152

거기다 풀이 과정까지 깔끔하게 완벽하게 정리
이야... 진짜 달라졌다는 게 눈에 보이더군요.


✍️ 총평

이전 세대 A.I들이 하나같이 버벅이고 틀렸던 문제를
GPT o3는 가장 빠르고 정확하게 정답 도출.
심지어 풀이 로직도 완벽하게 설명해줌.

지금처럼 빠르게 발전하면...

  • 법률, 의료, 과학, 교육, 창작 모든 분야에서
  • A.I가 인간의 도구를 넘어서 동료 혹은 대체자 역할까지 가능해지겠죠.

우리가 궁금해하거나 배우고 싶은 게 있다면
이제는 지치지 않고 계속 설명해주는 ‘AI 선생님’이 생긴 시대라는 거.

앞으로가 더 기대되네요.


🧠 요약

A.I 모델정답 유무속도비고
GPT o3 ✅ 정답 약 1분 18초 유일하게 정답 도출, 풀이 완벽
제미나이 2.5 Pro ❌ 오답 빠름 (~2분 이내) 가성비는 여전히 좋음
클로드 3.7 ❌ 실패 느림 (~5분 이상) 계산 돌리다 실패
딥시크 ❌ 오답 매우 느림 과거랑 동일
그록 ❌ 미완 응답 無 이번에도 무반응

📌 이 테스트의 핵심 포인트
AI가 단순히 답만 맞히는 게 아니라, 얼마나 논리적으로 사고하고 설명할 수 있는지,
그리고 얼마나 실전에서 쓸모있는 툴로 다가올 수 있는지를 본 실험이었습니다.

앞으로는 이런 실력차가 서비스 경쟁력으로 이어질 가능성,
진지하게 생각해볼 만하죠.

반응형