업스테이지는 최근 제기된 자사의 AI 모델 '솔라 오픈'에 대한 프롬 스크래치 논란에 대해 2일 서울 강남구 모처에서 현장 검증회를 열고 정면으로 반박했다. 유사하다고 주장하는 구간이 모델 전체의 0.0004%에 불과하고, 유사도 비교 기준도 적절하지 않다는 주장이다.
이번 논란은 사이오닉AI의 고석현 대표가 SNS 상에서 문제를 제기하며 불거졌다. 고 대표는 지난 1일 SNS에서 업스테이지의 솔라 오픈과 중국의 지푸에이아이에서 만든 '지엘엠 4.5 에어'의 유사도를 비교한 분석 글을 게시했다. 레이어정규화(LayerNorm) 파라미터(매개변수)의 코사인유사도(방향성의 유사도를 알 수 있음)를 비교하며 96.8% 동일하다고 주장했다.
이날 김성훈 업스테이지 대표는 모델 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 공개하고 이러한 주장이 사실이 아니라고 강조했다. 김성훈 대표는 "일부에서 제기한 레이어정규화 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다"면서 "해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표"라고 말했다.
또 레이어정규화 유사성 판단에 사용된 코사인 유사도 역시 적절한 비교 기준이 아니라고 설명했다. 코사인 유사도는 통상 언어모델들의 레이어정규화와 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상이라는 것이다.
업스테이지는 정규화를 통한 모델 특성을 반영하는 '피어슨 상관계수'로 재분석한 결과 솔라 오픈과 타 모델 간 패턴이 전혀 일치하지 않는다고 증명했다. 이는 솔라 오픈이 타 모델의 가중치를 재사용하지 않은 독립적 모델임을 뒷받침하는 명확한 통계적 근거다.
김성훈 대표는 “의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 AI3강을 향해 최선을 다하고 있는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것”이라며 “앞으로도 업스테이지는 투명한 기술 공개를 바탕으로 글로벌 최고 수준의 기술력을 증명하고 국내 AI생태계 확장에 힘쓰겠다”고 밝혔다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >





ryupro@sedaily.com








