생성형 인공지능(AI)이 작성한 온라인 댓글을 높은 정확도로 잡아낼 수 있는 기술이 국내에서 개발됐다. AI를 악용한 온라인 여론 조작 우려가 커지는 상황에서 이번에 개발된 기술이 관련 대응에 핵심 역할을 할 것으로 기대된다.
한국과학기술원(KAIST)은 김용대 전기및전자공학부 교수와 국가보안기술연구소 공동 연구팀이 한국어 AI 생성 댓글을 탐지하는 세계 최초의 기술 ‘XDAC’를 개발했다고 23일 밝혔다. 연구성과는 이달 27일 개최되는 AI 자연어처리 분야 최고 권위 학술대회 ‘ACL 2025’에 채택됐다.
비용 1원이면 생성형 AI로 댓글 1개를 만들 수 있고 이를 통해 온라인 여론을 쉽게 조작할 수 있다는 우려가 커지고 있다. AI가 작성한 댓글을 탐지하는 기술이 개발되고 있지만 현재 기술 대부분은 영어 댓글을 탐지하는 데 최적화했다. 한국어 댓글은 평균 51자로 짧고 구어체 표현이 많다는 특징도 있어 맞춤 기술 확보가 필요한 상황이다.
연구팀은 우선 사람이 작성한 댓글과 다른 AI 생성 댓글만의 패턴을 분석했다. 분석 결과 AI는 우선 ‘것 같다’, ‘에 대해’와 같은 형식적 표현과 ‘하지만’, ‘그런데’ 같은 접속어를 자주 사용했다. AI는 또 한국인이 주로 쓰는 ‘ㅋㅋㅋ’ 같은 감정표현 대신 전 세계적으로 통용되는 이모지를 사용하는 것으로 나타났다. 줄을 자주 바꾸거나 여러 칸을 띄어쓰는 습관은 사람과 달리 AI에게서는 잘 나타나지 않았다.
연구팀은 이 같은 차이를 XDAC에 집중적으로 학습시켰다. 그 결과 XDAC는 AI 생성 댓글을 얼마나 정확하게 탐지할 수 있는지를 시험하는 F1 점수에서 98.5%를 기록했다. 기존 기술보다 68% 향상된 수준이다. XDAC는 나아가 LLM별 말투 차이도 구별해 84.3% 정확도를 보였다. 가령 ‘GPT4o’는 정제되고 형식적인 톤, ‘라마(LLaMA)’는 구어체 톤이 강하다는 게 연구팀의 설명이다. XDAC에는 LLM 14종 활용, 자연스러움 강화, 세밀한 감정 제어, 참조자료를 통한 증강 생성 등 네 가지 전략이 적용됐다.
제1저자인 고우영 KAIST 선임연구원은 “생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고 생성 모델까지 식별할 수 있는 세계 최초 기술”이라며 “AI 기반 여론 조작 대응의 기술적 기반을 마련했다는 데 의의가 있다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >