美 스탠퍼드大 “딥시크? 50달러면 돼”

전체서비스

문화·스포츠

서경스타

스페셜 컨텐츠

이용안내

보내는 사람
받는 사람	※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

보내는 사람

받는 사람

※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

美 스탠퍼드大 “딥시크? 50달러면 돼”

입력2025-02-09 17:05:45 수정 2025.02.09 17:48:21 변수연 기자

‘저비용 고성능’을 앞세운 중국 인공지능(AI) 딥시크가 전 세계를 강타한 가운데 미국 대학 연구진이 50달러(약 7만 3000원)라는 초저비용으로 AI 모델을 개발해 주목을 끌고 있다.

9일(현지 시간) 외신에 따르면 스탠퍼드대와 워싱턴대 AI 연구진은 최근 발표한 연구 논문에서 최첨단 AI 추론 모델 ‘s1’을 공개하며 해당 모델이 수학 및 코딩 능력 테스트에서 오픈AI의 ‘o1’, 딥시크의 ‘R1’과 필적하는 성능을 보인다고 밝혔다.

연구진은 “s1 훈련에는 엔비디아 첨단 AI 칩인 H100 그래픽처리장치(GPU) 16개가 사용됐다”며 “훈련 과정은 30분도 걸리지 않았고 총비용도 50달러를 넘지 않았다”고 설명했다. s1 훈련에 필요한 클라우드 컴퓨팅 성능을 약 20달러에 빌릴 수 있었다고 덧붙였다.

연구진은 s1을 개발하는 과정에서 ‘증류(distillation)’ 방식을 사용했다고 밝혔다. 증류란 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해 유사한 기능을 개발하는 것을 의미한다.

딥시크는 오픈AI의 AI 모델을 증류하는 방식으로 훈련됐는데 개발 비용은 오픈AI ‘챗GPT’ 개발 비용의 5.6%에 불과한 557만 6000달러(약 80억 원)에 그쳤다.

s1은 구글의 최신 AI 모델인 제미나이 2.0 플래시 싱킹 익스페리멘털(Gemini 2.0 Flash Thinking Experimental)에서 증류했다. 연구진은 1000개의 정제된 질문과 답변, 구글 제미나이 2.0의 ‘추론 과정’이 합쳐진 데이터 세트로 s1을 훈련했다고 설명했다.

연구진은 s1의 답변 정확도를 높이기 위해 모델이 답변하기 전 “기다려라(wait)”라는 지시어를 추가하면 AI 모델의 사고 시간이 길어지면서 보다 정확한 답변을 생성한다는 사실도 발견했다.

딥시크에 이어 s1까지 ‘가성비(가격 대비 성능)’가 뛰어난 AI 모델이 속속 출시되면서 AI 인프라에 수십억 달러를 투자 중인 구글과 마이크로소프트(MS), 메타 등 대형 기술 기업들이 긴장하고 있지만 한계도 명확하다는 의견이 나온다. 전문가들은 증류 방식을 통해 기존 모델을 복제할 수 있지만 AI 성능의 획기적인 발전을 끌어내기는 어렵다고 보고 있다.