자연어처리(NLP) 인공지능(AI) 챗GPT의 등장이 글로벌 빅테크 간은 물론 국가 간 AI 경쟁으로 확전되고 있다. 마이크로소프트(MS)·구글이 이미 관련 시장을 선점한 듯하지만 AI 기술이 아직 초기라는 점에서 국내 기업들도 차별화된 전략을 펼친다면 충분히 승산이 있다는 분석이다.
8일 서울 영등포구 LG(003550)트윈타워에서 만난 배경훈 LG AI연구원장은 “챗GPT가 이토록 빨리 상용화된 것이 놀랍다”면서 “이를 위기로만 볼 게 아니라 국내 기업들에도 (실력을) 증명할 수 있는 기회가 될 수 있다”고 강조했다.
배 원장은 한국인공지능학회 부회장, 국가데이터정책위원회 위원 등을 겸하고 있으며 과거에는 국제인명센터로부터 올해의 국제과학자상, 세계선도과학자상 등을 받아 이름을 알렸다. 그가 수장으로 있는 LG AI연구원은 국내 대기업 단위에서는 가장 먼저 설립된 AI 연구 싱크탱크로 현재 그룹 계열사의 두뇌 역할을 담당하고 있다.
챗GPT 열풍에도 불구하고 배 원장은 관련 기술 수준이 아직 걸음마 단계라는 점에서 국내 기업들의 가능성을 강조했다. 배 원장은 “천문학적인 돈을 들인 기술을 그렇게 오픈한다는 것 자체가 아직 기술이 완성 단계가 아니라 가야 할 길이 멀다는 것을 의미한다”며 “현재 AI 기술 수준은 여전히 추론 영역에서 갈 길이 멀고 이 분야에서 의미 있는 성과를 거둔다면 기회는 얼마든지 있다”고 말했다.
이미 MS·구글과 같은 기업들이 범용적인 챗봇 서비스를 두고 패권 경쟁을 벌이는 상황에서 국내 기업들은 영역을 쪼개 의미 있는 성과를 축적하는 편이 효과적일 수 있다고 분석했다.
그는 “검색에서도 구글은 한국 기업들이 제공하는 고유 서비스 영역을 완전히 밀어내지 못했던 것처럼 한국 기업들도 각각의 영역에서 승부를 일단 봐야 한다”며 “유용한 서비스들을 하나하나 안착시키고 그러면서 장기적으로는 구글·MS와 같은 범용적인 모델을 만들어가는 것도 방법일 수 있다”고 강조했다.
우선 세분화한 영역에서 신뢰받는 AI 서비스를 하나둘 선보이면 이용자들이 모이고, 이용자들이 제공하는 데이터를 축적해 다시 언어 모델을 고도화하는 ‘양의 되먹임’ 구조를 구축할 수 있다는 얘기다. 한 영역의 성공은 다시 다른 영역의 성공으로 이어진다. 여러 영역에서 구축한 모델을 통합해 범용적인 모델을 만들 수 있다는 것이 배 원장의 큰 그림이다.
LG가 우선 일종의 ‘전문가형 챗GPT’ 모델에 집중하는 것도 이 때문이다. 그는 “제약·화학·바이오 등 다섯 가지 기초 영역에서 자연어 기반으로 전문적인 지식을 활용할 수 있는 서비스를 연내 출시할 계획”이라고 말했다.
다만 데이터셋 확보는 풀기 어려운 숙제다. 질 좋은 대량의 데이터는 AI 모델 고도화의 핵심이다. 넘쳐 나는 영어 데이터에 비해 한글 데이터는 제한적이다. 비영어권 국가의 숙명이기도 하다. 이를 극복하기 위해 LG는 영어와 한글 간 언어적 연관 관계를 분석해 영어 데이터를 통해 한국어 모델을 고도화하는 기술을 개발하고 있다.
배 원장은 AI 전쟁에서 정부의 역할도 중요하다고 강조했다. 그는 “정부 측에서도 공공데이터들을 개방하는 등 많은 노력들을 하고 있다”면서도 “정부와 민간의 활발한 소통과 협력을 통해 민간의 데이터 일부에 대한 접근까지 가능해진다면 AI 연구에 큰 도움이 될 것”이라고 덧붙였다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >