와이즈클로닝 봇은 인공지능으로 사람의 음성을 복제하는 서비스를 제공한다. 개인의 음색과 억양을 학습하는 인공지능 알고리즘을 통해 음성이 재현된다. 신호를 통해 음성의 인식과 재현이 이뤄지기 때문에 언어에 대한 제약이 없다고 회사는 설명했다.
일반적인 음성 복제에 필요한 시간은 4시간 정도다. 에이아이더 측은 “와이즈클로닝 봇은 음성 분석과 합성 시간을 10분으로 단축한다”며 “10분 내 음성 분석과 합성 복제는 음성 복제 기술을 다양한 시장에 적용 가능하게 할 수 있을 것”이라고 설명했다.
에이아이더는 광고 이미지와 모델 적합도를 음성 복제 기술을 시험 중이다. 음성복제 기술로 광고에 나오는 대사를 습득하고 10분 후 모델이 말하는 것과 동일한 음성을 얻을 수 있다.
김수화 에이아이더 대표는 “아직 사람의 감정을 완벽히 표현하지는 못 하지만, 앞으로 감정의 요소까지 딥러닝하여 음성을 복제 할 수 있게 될 것”라며, “음성 합성과 복제의 서비스를 AI 스피커와 같이 실 생활과 다양한 비즈니스 영역에서 쉽게 접할 수 있는 시기가 곧 올 수 있다”고 전했다.
에이아이더는 자연어 처리 머신러닝 기반 챗봇 서비스 등 언어처리 분야의 인공지능 기술이 뛰어난 회사로 음성 복제 영역으로 사업을 확장해 나가고 있다.
/박호현기자 greenlight@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >