성능이 장난 아닌 것 같음...
일단 성능 몇개 나열하자면:
소프트웨어 엔지니어링 문제들 (실제로 현직에 있는 엔지니어들이 푸는 문제들): 정답률 71.7% (이전 모델 48.9%)
컴피티션 코드 (코드 문제를 얼마나 잘 푸는지): 전 세계 175위 수준 - 이 정도면 전 세계 상위 0.05%의 개발자 수준 (이전 모델 상위 7% 정도)
박사 과정 과학 문제들 - 정답률 87.7% (이전 모델 78%)
올림피아드 수학 문제 - 정답률 96.7% (이전 모델 83.3%)
연구 수학 (보통 대학에서 수학 교수들이 논문 쓰고 연구하는 문제들): 정답률 25.2% (이전 모델들 2.0% 이하) - 난 이게 제일 놀랍고 신기