“병원 데이터를 분석해 의미 있는 인사이트를 도출해낸 기업은 전 세계적으로 드문 사례라 ‘구글클라우드 서밋’에 초청받아 발표를 진행했습니다. 비슷한 사업을 보유한 미국 ‘템퍼스AI’보다 카카오(035720)헬스케어의 사업성이 우수하다고 봅니다.”
황희 카카오헬스케어 대표는 병원 데이터를 활용한 기업간거래(B2B) 플랫폼 사업에도 자신감을 표했다. 카카오헬스케어는 각 의료기관에 분산된 의료 데이터를 표준화한 뒤 제약사나 임상시험수탁기관(CRO)이 활용 가능하도록 제공하는 대가로 이용료를 받는다. 데이터는 약효를 분석하거나 새로운 치료법을 개발하는 데 활용된다. 황 대표는 “신약을 개발할 때 제약사들이 임상시험 단계에서 대규모 자금을 투입하는 것은 이러한 데이터가 없기 때문”이라며 “수요는 높지만 데이터를 수집·가공·분석하는 작업이 모두 어렵기 때문에 실제 사업화에 성공한 기업은 전 세계적으로 드물다”고 말했다.
가장 큰 걸림돌은 개인정보 보안 문제로 병원들이 데이터 공개를 꺼린다는 점이었다. 하지만 황 대표가 20년간 병원에서 정보기술(IT)을 다룬 경험과 카카오의 기술력이 만나 이를 해결할 수 있었다. 그는 “과거에는 손으로 쓴 방대한 양의 데이터를 표준화하는 데 어려움이 컸지만 내부 논의 끝에 대규모언어모델(LLM)을 활용해 이를 해결했다”며 “정확도 99.97%의 데이터 익명화 엔진을 만들었고 구글이 제안한 ‘연합학습’ 기법을 활용해 병원의 우려를 해소했다”고 설명했다.
연합학습이란 여러 의료기관이 방대한 환자 데이터를 그대로 소유하되 인공지능(AI) 모델을 학습하기 위한 결과 값만 보내도록 하는 기술이다. 황 대표는 “연합학습 기술 난도가 높아 구글과 처음 논의할 당시 성공할 수 있을지 의구심이 컸지만 우리가 처음에 1000만 명의 데이터를 볼 수 있게 만들어놓으니 크게 놀라워했다”고 소개했다.
황 대표는 카카오헬스케어가 보유한 병원 데이터의 사업성이 미국의 AI 정밀 의료 기업인 템퍼스AI보다 뛰어나다고 자신감을 표했다. 템퍼스AI는 유전체 데이터를 먼저 확보한 반면 카카오헬스케어는 임상 데이터부터 확보했기 때문이다. 황 대표는 “유전체 데이터와 임상 데이터를 결합해야 의미 있는 데이터가 되는데, 템퍼스AI는 지금 임상 데이터를 구축하기 위해 병원 협조를 구하는 데 애를 먹고 있다고 한다”며 “유전체 데이터만 가지고는 아무 것도 할 수 없지만 임상 데이터만 있을 때는 약의 효능·부작용 평가, 약물 간 비교 등 할 수 있는 사업이 많기 때문에 둘 중에 먼저 확보해야 하는 것은 임상 데이터라고 확신한다”고 했다.
카카오헬스케어는 올해 말까지 주요 병원 17곳을 데이터 플랫폼 구축 대상으로 확보했다. 특히 병원에서 카카오헬스케어와의 협력 관련 호평이 이어지고 있는 점은 긍정적인 요인이다. 황 대표는 “병원 입장에서는 카카오헬스케어와의 협력을 계기로 쓸 수 없던 데이터를 활용할 수 있게 되니 원내 연구자들에게 열어달라는 요청을 하기도 한다”며 “병원 원장님들을 다 찾아뵙고 걱정하는 부분을 설득해 동의를 받은 만큼 신뢰를 최우선으로 해 데이터 사업을 진행하려 한다”고 강조했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >