“글로벌 최대 규모의 ‘이미지 텍스트 멀티모달’ 데이터셋을 구축해 내년 초 공개할 계획입니다. 함께 할 파트너를 찾아 카카오(035720)만의 인공지능(AI) 연구를 하겠습니다.”
김일두 카카오브레인 대표는 20일 초거대AI 로드맵을 발표하는 기자간담회에서 이 같이 밝혔다. 멀티모달은 텍스트만이 아니라 영상, 이미지 등 다양한 형태의 정보를 활용하는 모델이다. 카카오브레인은 최근 명령어를 입력하면 맥락에 맞게 그림을 그려내는 초거대AI 멀티모달 ‘민달리(minDALL-E)’를 선보인 바 있다. 앞으로 이보다 더 수준 높은 AI 멀티모달을 내놓기 위해 데이터셋을 오픈한다는 계획이다. 김 대표는 이를 ‘넥스트 이미지넷 프로젝트’라고 명명했다.
김 대표는 “최근 AI가 텍스트와 이미지를 같이 이해하는 쪽으로 연구가 가속화되고 있다”며 “구글은 18억 건의 데이터셋을 구축해 연구 성과를 알리고 있고 오픈AI도 10억 건 이상의 데이터셋을 만들어 앞서 나가고 있다”고 말했다. 그는 “카카오브레인은 20억 건의 데이터셋을 구축했고 내년 1월 중 일부를 공개할 수 있을 것으로 보인다”고 전했다. 카카오브레인은 멀티모달 데이터셋을 확용해 포털 다음 내 이미지 검색이나 카카오톡, 쇼핑 등 다양한 서비스에 적용할 예정이다.
김 대표는 인식, 경우의 수 계산을 넘어 추론까지 해내는 AI가 카카오브레인의 지향점이라고 밝혔다. 예를 들어 민달리에게 ‘바나나 의자’를 그려 달라 했을 때 바나나 껍질이 말린 형태의 의자를 만들어 내는 것이다. AI가 사람처럼 상상력까지 발휘하는 수준으로 고도화 시키겠다는 목표다. 특히 교육과 헬스케어 분야에서의 난제들을 해결할 수 있을 것으로 기대했다. 김 대표는 “선생님에 따라 비용이 아주 비싸지는 것처럼 교육, 헬스케어는 (주어진 환경에 따라) 접근성은 떨어지는 반면 고부가가치를 낼 수 있는 영역”이라며 “내년부터 기술적 성취에 머무르지 않고 AI가 실제 세상을 바꾸는 기술로서 의미를 갖도록 도전해 보려고 한다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >