요즘 AI 모델들 줄줄이 업데이트 됐다는 소식, 들으셨죠?
- 제미나이 2.5 Pro
- GPT o3
- 클로드 3.7
이젠 슬슬 기대해볼만 하지 않겠습니까?
그래서! 같은 수능 문제로 다시 실험 돌려봤습니다. (정답은 "152"로 고정)
클로드 3.7
처음엔 꽤 잘하나 싶었어요.
4분 넘으니 "계속하기" 누르라 하고, 계산도 열심히 하더라고요?
그런데 결론은...
못 풀었다고 검색 다시 해본대요.
또 기다리니까
더 정확히 풀겠다며 다시 계산 돌리는데
또 토큰 초과로 "계속하기" 반복...
결국 이번에도 탈락.
시간 끌더니… 실패로 끝났습니다.
제미나이 2.5 Pro
요즘 제일 핫한 가성비 모델이죠?
속도는 괜찮았습니다. 꽤 빠르게 풀이 시작해서
"정답은 147입니다!"
...응? 아니야... 정답은 152거든?
틀렸습니다! ❌
그래도 속도는 준수했으니까, 그건 인정.
그록
지난번에도 48분 돌려보다가 포기했는데, 이번에도 여전하더군요.
“생각 중...”만 띄워놓고 움직임 없음.
패스합니다.
딥시크
역시나 개선이 없어서 시간 엄청 걸렸고요.
결과는 역시 오답.
이쪽은 변화가 없네요. 아직 멀었음...
GPT o3 – 진짜 주인공 등장
마지막으로 GPT o3, 가장 최근에 나온 모델!
결과는?
- 풀이 시작부터 끝까지 1분 18초
- 정답: ✅ 152
거기다 풀이 과정까지 깔끔하게 완벽하게 정리
이야... 진짜 달라졌다는 게 눈에 보이더군요.
✍️ 총평
이전 세대 A.I들이 하나같이 버벅이고 틀렸던 문제를
GPT o3는 가장 빠르고 정확하게 정답 도출.
심지어 풀이 로직도 완벽하게 설명해줌.
지금처럼 빠르게 발전하면...
- 법률, 의료, 과학, 교육, 창작 모든 분야에서
- A.I가 인간의 도구를 넘어서 동료 혹은 대체자 역할까지 가능해지겠죠.
우리가 궁금해하거나 배우고 싶은 게 있다면
이제는 지치지 않고 계속 설명해주는 ‘AI 선생님’이 생긴 시대라는 거.
앞으로가 더 기대되네요.
🧠 요약
GPT o3 | ✅ 정답 | 약 1분 18초 | 유일하게 정답 도출, 풀이 완벽 |
제미나이 2.5 Pro | ❌ 오답 | 빠름 (~2분 이내) | 가성비는 여전히 좋음 |
클로드 3.7 | ❌ 실패 | 느림 (~5분 이상) | 계산 돌리다 실패 |
딥시크 | ❌ 오답 | 매우 느림 | 과거랑 동일 |
그록 | ❌ 미완 | 응답 無 | 이번에도 무반응 |
📌 이 테스트의 핵심 포인트
AI가 단순히 답만 맞히는 게 아니라, 얼마나 논리적으로 사고하고 설명할 수 있는지,
그리고 얼마나 실전에서 쓸모있는 툴로 다가올 수 있는지를 본 실험이었습니다.
앞으로는 이런 실력차가 서비스 경쟁력으로 이어질 가능성,
진지하게 생각해볼 만하죠.
'웹&PC' 카테고리의 다른 글
구글 클라우드 2025 오프닝 키노트 요약: 진짜 ‘AI 제국’을 선포한 날 (0) | 2025.04.11 |
---|---|
GPT신기능으로10분만에논문초안?맥킨리관세(McKinleyTariff) (0) | 2025.02.06 |
챗GPT 502 Bad Gateway 오류: 원인과 해결 방안 (0) | 2025.01.23 |
갤럭시 탭 플러스 모델, 왜 추천하지 않는가? (0) | 2025.01.13 |
키보드 구매 가이드: 키린이를 위한 기초 지침서 (0) | 2024.12.31 |