전체메뉴

검색
팝업창 닫기
이메일보내기

카카오브레인 "세계 최대 텍스트-이미지 AI 데이터셋 공개"

김일두 대표 초거대AI 기자간담회

"20억건 데이터셋 구축…내년 초 공개"

"기술 성취에 머물지 않고 세상 바꿀 것"

김일두 카카오브레인 대표가 20일 기자간담회에서 발표하고 있다./구글미트 캡처




“글로벌 최대 규모의 ‘이미지 텍스트 멀티모달’ 데이터셋을 구축해 내년 초 공개할 계획입니다. 함께 할 파트너를 찾아 카카오(035720)만의 인공지능(AI) 연구를 하겠습니다.”

김일두 카카오브레인 대표는 20일 초거대AI 로드맵을 발표하는 기자간담회에서 이 같이 밝혔다. 멀티모달은 텍스트만이 아니라 영상, 이미지 등 다양한 형태의 정보를 활용하는 모델이다. 카카오브레인은 최근 명령어를 입력하면 맥락에 맞게 그림을 그려내는 초거대AI 멀티모달 ‘민달리(minDALL-E)’를 선보인 바 있다. 앞으로 이보다 더 수준 높은 AI 멀티모달을 내놓기 위해 데이터셋을 오픈한다는 계획이다. 김 대표는 이를 ‘넥스트 이미지넷 프로젝트’라고 명명했다.



김 대표는 “최근 AI가 텍스트와 이미지를 같이 이해하는 쪽으로 연구가 가속화되고 있다”며 “구글은 18억 건의 데이터셋을 구축해 연구 성과를 알리고 있고 오픈AI도 10억 건 이상의 데이터셋을 만들어 앞서 나가고 있다”고 말했다. 그는 “카카오브레인은 20억 건의 데이터셋을 구축했고 내년 1월 중 일부를 공개할 수 있을 것으로 보인다”고 전했다. 카카오브레인은 멀티모달 데이터셋을 확용해 포털 다음 내 이미지 검색이나 카카오톡, 쇼핑 등 다양한 서비스에 적용할 예정이다.



김 대표는 인식, 경우의 수 계산을 넘어 추론까지 해내는 AI가 카카오브레인의 지향점이라고 밝혔다. 예를 들어 민달리에게 ‘바나나 의자’를 그려 달라 했을 때 바나나 껍질이 말린 형태의 의자를 만들어 내는 것이다. AI가 사람처럼 상상력까지 발휘하는 수준으로 고도화 시키겠다는 목표다. 특히 교육과 헬스케어 분야에서의 난제들을 해결할 수 있을 것으로 기대했다. 김 대표는 “선생님에 따라 비용이 아주 비싸지는 것처럼 교육, 헬스케어는 (주어진 환경에 따라) 접근성은 떨어지는 반면 고부가가치를 낼 수 있는 영역”이라며 “내년부터 기술적 성취에 머무르지 않고 AI가 실제 세상을 바꾸는 기술로서 의미를 갖도록 도전해 보려고 한다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인