네이버의 인공지능(AI) 모델 ‘하이퍼클로바X’가 글로벌 연구자들이 추진한 다국어 AI 성능 평가 벤치마크 구축 프로젝트에서 한국어 벤치마크 제작 과정에 활용된 것으로 확인났다. 하이퍼클로바X는 이번 한국어 성능평가 시험 문제를 제작에 투입된 국내 유일 모델이다.
25일 정보기술(IT) 업계에 따르면 타일러 장 UC샌디에이고 인지과학 박사(현 구글 딥마인드 연구원)가 이끈 연구팀은 ‘문화적 특수성이 반영된 물리적 상식 벤치마크’를 구축하는 과정에서 한국어 데이터를 만들기 위해 네이버의 경량화 추론 AI 모델 ‘하이퍼클로바X 시드14B 싱크’를 활용했다. 이 연구는 이달 5일부터 9일까지 열린 자연어처리 학회 ‘EMNLP 2025’의 부속 ‘다국어 표현 학습 워크샵’에서 발표됐다.
연구진은 한국어 성능 검증을 하기 위한 벤치마크 조성에 하이퍼클로바X를 활용했다. 연구팀은 얼어붙은 장독대를 여는 방법, 달고나가 부러지는 순간 등 문화적 맥락이 반영된 85개의 한국어 물리 상식 벤치마크를 구축했다. 이번 연구가 발표직 후 하이퍼클로바X 시드14B 싱크 모델 다운로드 수는 글로벌 오픈소스 플랫폼 허깅페이스에서 약 5만 5000회 늘었다.
네이버는 하이퍼클로바X가 한국어 특유의 맥락과 표현을 반영해 이번 연구에서 활용됐다고 설명했다. 네이버의 오픈소스 모델은 공개 후 약 6개월 만에 허깅페이스에서 누적 다운로드 200만 건을 돌파한 바 있다. 네이버 관계자는 “소버린 AI로서 하이퍼클로바X의 가치가 글로벌 AI 연구자들에게도 인정받은 성과”라고 설명했다.
네이버는 자체 AI 모델을 지속해서 고도화할 예정이다. 네이버는 국가대표 AI 모델을 가리는 ‘독자 AI 파운데이션 모델’ 개발 사업의 1차 지원 대상 기업에 이름을 올린 바 있다. 텍스트·이미지·오디오·비디오 등 이종 데이터를 통합 이해·생성하는 ‘옴니모달리티(Omnimodality)’ AI 모델을 개발 중이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >





kim@sedaily.com








