“불소의 양을 줄일 수 있는 새로운 배터리 소재를 찾아줘.”
LG(003550) 인공지능(AI) 연구원이 초거대 AI ‘엑사원(EXAONE) 2.0’을 공개했다. 엑사원은 신소재부터 신약 개발까지 전문 영역에서 활용할 수 있는 일종의 LG버전 챗GPT로 볼 수 있다.
지난 19일 LG 마곡 사이언스파크에서 진행된 ‘AI 토크콘서트’ 엑사원 시연 현장에서는 정보기술(IT)은 물론 화학과 바이오 등 산업 경계를 넘나드는 다양한 질문이 AI에 던져졌다. 질문이 입력되면 10초 안에 3~4페이지에 달하는 긴 답변이 청중 앞에 출력됐다. 배터리 소재와 관련된 질문에서는 선행 연구가 진행된 논문을 기반으로 기존 배터리 첨가제의 분자 구조를 보여주면서 신소재 발굴을 위한 솔루션을 곧바로 제시했다. 고도의 전문 지식이 요구되는 질문에 대해서도 설득력 있는 답변을 내놓을 수 있다는 점을 과시한 셈이다.
논문 4500만·이미지 3.5억건 배운 AI…상위 1% 전문가로 변신
엑사원은 LG AI 연구원이 2021년 12월 처음 선보인 초거대 AI 모델이다. 이번에 공개된 엑사원 2.0은 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어(Bilingual) 모델을 지녔고 학습 데이터 양도 기존 모델 대비 4배 이상 늘렸다. 특허·논문 학습 자료는 약 4500만 건에 달하고 학습한 이미지는 3억 5000만 장을 넘는다. 성능도 개선됐다. 엑사원 2.0의 언어 모델은 기존 모델 대비 추론 처리 시간을 25% 단축하고 메모리 사용량은 70% 줄여 비용을 78% 절감했다.
엑사원은 이처럼 개선된 성능을 바탕으로 전문가 AI 서비스 구축을 위해 △유니버스(전문가용 대화형 AI 플랫폼) △디스커버리(신소재·신물질·신약 개발 플랫폼) △아틀리에(이미지 생성 플랫폼) 등 3종의 플랫폼을 이날 공개했다. 플랫폼별 맞춤 서비스로 잠재 고객을 잡겠다는 구상이다.
배경훈 LG AI연구원장은 “최신 AI 기술이 단순히 연구에만 그치면 안 되고 사업화로 증명되는 것이 중요하다고 생각한다”며 “현재 LG전자, LG유플러스, LG CNS 등의 계열사와 협력해 좋은 AI 비즈니스 모델을 만드는 데 집중하고 있다"고 말했다.
실제 엑사원 유니버스는 다른 대화형 AI들과 달리 각 도메인별 최신 전문 데이터까지 포함해 답변을 생성한다. 디스커버리에는 논문과 특허 등 전문 문헌의 텍스트뿐 아니라 분자구조·수식·차트·테이블·이미지 등 비텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스화하는 심층문서이해(DDU) 기술이 적용됐다. DDU 기술 활용 시 신소재·신물질 발굴 기간은 40개월에서 5개월까지 극적으로 단축될 것으로 기대된다.
전문가용 등 3종 플랫폼 사업화 시동
플랫폼을 공통적으로 아우르는 강점으로는 ‘신뢰성’을 강조했다. 챗GPT를 비롯한 생성형 AI의 최대 맹점으로 꼽히는 ‘환각 현상(허구를 진실처럼 대답하는 현상)’을 최소화했다는 것이다. 배 원장은 “답할 수 없는 문제에 ‘답할 수 없다’고 답하는 것은 엑사원이 세계 최고 수준”이라고 설명했다.
본격적인 사업화 시점도 코앞으로 다가왔다. 엑사원 유니버스의 AI·머신러닝 분야 서비스는 이달 말부터 LG그룹 내 AI 연구자, 협력 중인 대학을 대상으로 시행된다. 화학·바이오·제약·의료·금융·특허 등 엑사원 유니버스의 도메인별 특화 서비스도 준비하고 있다. 3분기에는 그룹 내외부의 전문 디자이너를 대상으로 아틀리에 서비스를, 4분기에는 그룹 내 화학 및 바이오 분야 연구진을 대상으로 디스커버리 서비스를 제공할 예정이다.
기업간거래(B2B) 영역에 집중하되 기업과 소비자 간 거래(B2C) 사업화 가능성도 열어놓았다. 배 원장은 “엑사원 유니버스의 경우 AI 관련 일부 기능을 일반 연구자들이 사용할 수 있도록 공개할 예정”이라며 “아틀리에의 이미지 설명(캡셔닝) 기능은 일부 B2C 사업화도 진행할 계획”이라고 했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >