GPT-5가 2025학년도 수능 문제를 풀고 수도권 상위권 대학 진학이 가능한 수준의 점수를 기록하면서 화제를 모으고 있다.
오픈AI가 7일(현지시간) 공개한 최신 대형언어모델(LLM) GPT-5가 국어, 수학, 영어 영역의 2025학년도 수능 문제를 풀고 상위권 성적을 기록했다.
GPT-5는 기존 GPT-4o(플래그십 대화형 모델)와 o3(추론 특화 모델)을 결합하고 한 단계 고도화한 모델이다.
8일 GPT-5에 수능 국어(화법과 작문), 수학(미적분), 영어 영역 문항 전체를 입력하고 채점한 결과 각 영역에서 국어 95점, 수학 82점, 영어 92점을 받았다. 이는 작년 수능 기준으로 국어와 영어는 1등급 커트라인을 통과했고, 수학은 2등급 수준이다.
특히 GPT-4.5에 비해 가장 뚜렷한 개선점은 수학 계산 속도와 정확성이었다. 수학 영역 30문항 전체를 이미지 캡처로 제시했음에도 GPT-5는 1~2초 만에 정답을 제시했다. 4점이 걸린 고난도 문항인 29번, 30번 주관식 문제는 약 1분 30초가량 계산 시간을 들였고 이 중 하나를 풀이 과정까지 정확히 맞췄다.
수식 표현도 LaTeX 언어를 활용해 사람이 읽기 편하게 풀이 과정을 표현했다. 다만, 여러 조건을 따져야 하는 추론형 문항이나 도형 기반 기하 문제에서는 오답을 내거나 '정답이 없다'는 식의 응답을 보여 아쉬운 면도 드러냈다.
국어 영역에서는 총 2문제를 틀렸다. 비문학과 글쓰기 문항은 완벽하게 맞혔지만 현대시와 고전 시가를 비교하거나 맥락을 묻는 문제에서 ‘매력적인 오답’을 고르는 실수를 보였다.
영어의 경우 예상과 달리 4문제를 틀렸으며 문장의 적절한 순서 배열을 요구하는 37번, 43번 문제에선 재시도 기회를 줘도 동일한 오답을 반복해 한계가 드러났다.
탐구 영역에서는 과목에 따라 편차가 컸다. 사회탐구 과목(사회문화, 윤리와 사상)에서는 고난도 문제도 풀어냈지만 과학탐구 과목 중 물리, 화학 등은 도표 분석이 필요한 문항에서 정답률이 낮았다.
한 국내 AI 기업 관계자는 "테스트해보니 긴 문장을 좀 더 안정적으로 처리하는 느낌이 들지만 이미지 인지 능력에서는 다소 아쉽다"며 "최근 구글이 공개한 '지니3'처럼 새로운 패러다임을 제시하는 수준은 아니었다"라고 평가했다.
한편, GPT-5의 전 세대 모델인 GPT-4o는 지난해 동일한 수능 국어 영역을 풀었을 때 75점으로 4등급에 머문 바 있어 이번 GPT-5의 성적이 더욱 주목된다.
오픈AI의 CEO 샘 올트먼은 이날 "GPT-3는 고등학생 수준, GPT-4는 대학생 수준이었다면, GPT-5는 박사급 지능을 갖췄다"고 강조하며 향후 더욱 진화된 모델의 등장을 예고했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >