전체메뉴

검색
팝업창 닫기
이메일보내기

美 스탠퍼드大 “딥시크? 50달러면 돼”

최첨단 AI 추론 모델 's1' 공개

수학·코딩능력 오픈AI 등 필적

중국 인공지능(AI) 딥시크. AP연합뉴스




‘저비용 고성능’을 앞세운 중국 인공지능(AI) 딥시크가 전 세계를 강타한 가운데 미국 대학 연구진이 50달러(약 7만 3000원)라는 초저비용으로 AI 모델을 개발해 주목을 끌고 있다.

9일(현지 시간) 외신에 따르면 스탠퍼드대와 워싱턴대 AI 연구진은 최근 발표한 연구 논문에서 최첨단 AI 추론 모델 ‘s1’을 공개하며 해당 모델이 수학 및 코딩 능력 테스트에서 오픈AI의 ‘o1’, 딥시크의 ‘R1’과 필적하는 성능을 보인다고 밝혔다.

연구진은 “s1 훈련에는 엔비디아 첨단 AI 칩인 H100 그래픽처리장치(GPU) 16개가 사용됐다”며 “훈련 과정은 30분도 걸리지 않았고 총비용도 50달러를 넘지 않았다”고 설명했다. s1 훈련에 필요한 클라우드 컴퓨팅 성능을 약 20달러에 빌릴 수 있었다고 덧붙였다.

연구진은 s1을 개발하는 과정에서 ‘증류(distillation)’ 방식을 사용했다고 밝혔다. 증류란 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해 유사한 기능을 개발하는 것을 의미한다.



딥시크는 오픈AI의 AI 모델을 증류하는 방식으로 훈련됐는데 개발 비용은 오픈AI ‘챗GPT’ 개발 비용의 5.6%에 불과한 557만 6000달러(약 80억 원)에 그쳤다.

s1은 구글의 최신 AI 모델인 제미나이 2.0 플래시 싱킹 익스페리멘털(Gemini 2.0 Flash Thinking Experimental)에서 증류했다. 연구진은 1000개의 정제된 질문과 답변, 구글 제미나이 2.0의 ‘추론 과정’이 합쳐진 데이터 세트로 s1을 훈련했다고 설명했다.

연구진은 s1의 답변 정확도를 높이기 위해 모델이 답변하기 전 “기다려라(wait)”라는 지시어를 추가하면 AI 모델의 사고 시간이 길어지면서 보다 정확한 답변을 생성한다는 사실도 발견했다.

딥시크에 이어 s1까지 ‘가성비(가격 대비 성능)’가 뛰어난 AI 모델이 속속 출시되면서 AI 인프라에 수십억 달러를 투자 중인 구글과 마이크로소프트(MS), 메타 등 대형 기술 기업들이 긴장하고 있지만 한계도 명확하다는 의견이 나온다. 전문가들은 증류 방식을 통해 기존 모델을 복제할 수 있지만 AI 성능의 획기적인 발전을 끌어내기는 어렵다고 보고 있다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인