카카오브레인 '세계 최대 텍스트-이미지 AI 데이터셋 공개'

전체서비스

문화·스포츠

서경스타

스페셜 컨텐츠

이용안내

보내는 사람
받는 사람	※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

보내는 사람

받는 사람

※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

카카오브레인 "세계 최대 텍스트-이미지 AI 데이터셋 공개"

입력2021-12-20 15:03:47 수정 2021.12.20 15:05:37 박현익 기자

김일두 카카오브레인 대표가 20일 기자간담회에서 발표하고 있다./구글미트 캡처

“글로벌 최대 규모의 ‘이미지 텍스트 멀티모달’ 데이터셋을 구축해 내년 초 공개할 계획입니다. 함께 할 파트너를 찾아 카카오(035720)만의 인공지능(AI) 연구를 하겠습니다.”

김일두 카카오브레인 대표는 20일 초거대AI 로드맵을 발표하는 기자간담회에서 이 같이 밝혔다. 멀티모달은 텍스트만이 아니라 영상, 이미지 등 다양한 형태의 정보를 활용하는 모델이다. 카카오브레인은 최근 명령어를 입력하면 맥락에 맞게 그림을 그려내는 초거대AI 멀티모달 ‘민달리(minDALL-E)’를 선보인 바 있다. 앞으로 이보다 더 수준 높은 AI 멀티모달을 내놓기 위해 데이터셋을 오픈한다는 계획이다. 김 대표는 이를 ‘넥스트 이미지넷 프로젝트’라고 명명했다.

김 대표는 “최근 AI가 텍스트와 이미지를 같이 이해하는 쪽으로 연구가 가속화되고 있다”며 “구글은 18억 건의 데이터셋을 구축해 연구 성과를 알리고 있고 오픈AI도 10억 건 이상의 데이터셋을 만들어 앞서 나가고 있다”고 말했다. 그는 “카카오브레인은 20억 건의 데이터셋을 구축했고 내년 1월 중 일부를 공개할 수 있을 것으로 보인다”고 전했다. 카카오브레인은 멀티모달 데이터셋을 확용해 포털 다음 내 이미지 검색이나 카카오톡, 쇼핑 등 다양한 서비스에 적용할 예정이다.

김 대표는 인식, 경우의 수 계산을 넘어 추론까지 해내는 AI가 카카오브레인의 지향점이라고 밝혔다. 예를 들어 민달리에게 ‘바나나 의자’를 그려 달라 했을 때 바나나 껍질이 말린 형태의 의자를 만들어 내는 것이다. AI가 사람처럼 상상력까지 발휘하는 수준으로 고도화 시키겠다는 목표다. 특히 교육과 헬스케어 분야에서의 난제들을 해결할 수 있을 것으로 기대했다. 김 대표는 “선생님에 따라 비용이 아주 비싸지는 것처럼 교육, 헬스케어는 (주어진 환경에 따라) 접근성은 떨어지는 반면 고부가가치를 낼 수 있는 영역”이라며 “내년부터 기술적 성취에 머무르지 않고 AI가 실제 세상을 바꾸는 기술로서 의미를 갖도록 도전해 보려고 한다”고 말했다.