SK텔레콤이 독자 구축한 거대언어모델(LLM) ‘에이닷엑스 3.1’을 오픈 소스 커뮤니티 허깅페이스(Hugging Face)에 공개했다고 24일 밝혔다.
‘에이닷엑스 3.1’은 340억 개(34B)의 매개변수를 기반으로 하며, SK텔레콤이 프롬 스크래치 방식(모델의 맨 처음 단계부터 모두 직접 구축)으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했다. 이번에 공개한 ‘에이닷엑스 3.1’은 ‘에이닷엑스 3.0’을 기능을 대폭 개선했다. 한국어 대화 성능에 집중했던 ‘에이닷엑스 3.0’과 달리 이번 버전에서는 추론모델로의 확장 가능성을 고려해 코드와 수학성능을 대폭 향상시켰다. 이로써 SK텔레콤은 프롬 스크래치 방식의 ‘에이닷엑스 3.1’ 모델 2종(표준·경량)과 대규모 학습(CPT, Continual Pre-Training)에 기반한 ‘에이닷엑스 4.0’ 모델 2종(표준·경량)까지 총 4개의 모델을 오픈소스로 공개했다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.
‘에이닷엑스 3.1’은 자사 ‘에이닷엑스 4.0’과 비교할 때 절반 이하의 매개변수로 구성되었지만, 같은 한국어 서비스에 적용될 경우 약 90% 수준의 성능을 발휘한다. 사용자들은 ‘에이닷엑스 3.1’과 ‘에이닷엑스 4.0’ 중 사용 환경에 더 적합한 성능과 효율을 고려해 선택할 수 있다. ‘에이닷엑스 3.1’ 모델은 대표적인 한국어 능력 평가 벤치마크인 KMMLU에서 69.20으로, 78.3을 획득한 ‘에이닷엑스 4.0’ 대비 88% 수준을 확인했고, 한국어 및 한국 문화 벤치마크인 CLIcK에서는 90% 수준의 성능을 기록했다.
한편 SK텔레콤은 그 동안 확보한 우수한 LLM 기술 역량을 바탕으로 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에 지원했다. SK텔레콤 컨소시엄은 반도체, 모델, 데이터, 서비스로 이어지는 독자 기술 기반의 풀스택 AI를 구현하고, 개발하는 모델을 국내 AI 생태계의 다양한 기업들에 오픈소스로 개방하는 것을 목표로 하고 있다. 컨소시엄에는 국내 최대 게임 상장사 크래프톤을 비롯, 모빌리티 데이터 부분의 강자 포티투닷, 국내 최고 수준의 추론형 AI반도체(NPU) 제작사인 리벨리온, 전문 지식·정보 검색에 특화된 AI 에이전트인 라이너, AI 모델의 데이터 안정성을 확보하는 기술을 갖춘 셀렉트스타 등 다양한 분야를 아우르는 회사들과 함께 학계를 대표하는 서울대학교 연구실들과 KAIST 연구진 등이 참여한다.
또한, SK텔레콤 컨소시엄이 만들어낼 AI모델을 사용하기로 의향서를 낸 업체 중에는 SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사들은 물론이고, SK텔레콤이 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등이 포함됐다. 참여 의향서 제출 기업은 추후 더 늘어날 전망이다.
SK텔레콤 컨소시엄은 자체 개발 LLM인 A.X와 각 참여사가 보유한 자체 LLM 및 데이터 등을 기반으로 하여 대한민국을 대표하는 독자 파운데이션 신규 모델을 만들어갈 계획이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >