로봇시대 '눈과 뇌' 공간지능 모델로 피지컬AI 선도 [테크언커버드]

전체서비스

문화·스포츠

서경스타

스페셜 컨텐츠

이용안내

보내는 사람
받는 사람	※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

보내는 사람

받는 사람

※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

로봇시대 '눈과 뇌' 공간지능 모델로 피지컬AI 선도 [테크언커버드]

입력2025-11-05 17:58:23 수정 2025.11.05 18:41:21 김흥록 기자

네이버랩스의 공간 매핑 로봇 M2의 모습 로봇에 장착된 다양한 센서가 공간 데이터를 수집해 3차원(3D) 모델을 생성한다. 사진제공=네이버랩스

내비게이션이나 스마트폰 길 안내 서비스에 적용되는 가장 기본적인 기술은 위성 위치 확인 시스템(GPS)이다. 정확도나 이용 범위는 한계가 있다. 위치 인식의 오차 범위가 50m에 이른다. 터널이나 실내처럼 하늘이 가려지는 공간에서는 작동 자체가 되지 않는다. 이를 보완해 스마트폰 등 공간 관련 기능을 갖춘 기기는 현재 대부분 이동통신망이나 와이파이 신호를 GPS의 보완 수단으로 쓴다. 5G 기지국이나 와이파이 공유기와의 거리 등을 측량해 위치 인식의 정확도를 높이는 식이다. 그럼에도 여전히 적게는 3m, 많게는 20m의 공간 오차가 발생한다.

이 정도의 오차가 사람에게는 괜찮을 수 있다. 하지만 로봇이라면 어떨까. 장거리 배달 로봇에게 실제 서있는 공간과 3~20m 오차가 있는 위치 정보를 주었을 때 물건을 건물 안까지 정확히 배달하기를 기대하기는 어려워진다. 실내에서 여러 층을 오가며 사람들의 각종 활동을 돕는 로봇이라면 그 한계는 더욱 뚜렷해진다. 위치의 오차도 오차지만, GPS나 현재의 2차원 지도로는 로봇이 공간 자체를 인식할 수 없기 때문이다. 현재의 기술은 로봇과 인간이 공존하는 미래의 공간 기술로는 부적합한 셈이다.

정보기술(IT) 업계는 인공지능(AI)이 로봇으로 확장하는 피지컬AI의 단계로 가는 진화는 AI가 언어를 넘어 공간을 이해하는 능력, 즉 ‘공간 지능(Spatial Intelligence)’에 달려 있다고 보고 있다. 공간 지능이 기계와 현실 세계가 상호작용하는 핵심 연결고리기 때문이다. 그리고 현재 전 세계에서 공간지능 기술 분야에서 가장 앞서간다는 평가를 받고 있는 기업 중 한 곳이 우리나라의 대표 IT기업인 네이버다. 네이버에서 선행기술 연구를 담당하는 네이버랩스는 국내와 유럽에서 이미 2016년 부터 AI 기반의 공간지능 연구를 수행하고 있다.

코엑스 실내에서 길 찾는 기술, 알고보니 네이버가 준비한 ‘로봇의 시각 기관’

현재 네이버의 일부 서비스에서 미래 로봇이 사용할 수 있는 공간지능 기술을 엿볼 수 있다. 그 중에 하나가 바로 네이버지도에서도 이용할 수 있는 서울 코엑스의 ‘AR 길찾기’ 서비스다. 기존 AR 내비게이션이 주로 야외에서 제공됐던 것과 달리 이번 기술은 GPS 신호가 닿지 않는 코엑스 실내를 대상으로 한다. 코엑스몰은 연면적이 축구장 70배 크기로 넓은 데다 수많은 가게가 섞여있는 곳이다. 이용자는 이곳에서 카메라로 주변을 스캔하기만 하면 현재 위치가 자동 인식되고, 화면 위에 화살표 형태의 이동 경로가 AR로 표시된다.

여기에는 네이버의 공간 기술이 3단계로 구현돼 있다. 첫 번 째 기술은 ‘디지털 트윈’이다. 디지털 트윈은 현실 세계의 공간을 디지털상에 그대로 옮겨놓은 디지털 가상 공간이다. 전용 장비를 이용해 촬영한 후 처리를 거치면 공간이 디지털로 복사되는 셈이다. 이를 ‘매핑(mapping)’이라 부른다. 매핑된 공간인 디지털트윈은 3D로 인식되는 것이 특징이다.

전용 장비를 통해 코엑스 실내외 현실 세계를 '디지털 트윈'으로 구현한 모습. 네이버

다음에는 기기나 로봇이 현재 자신의 위치를 찾아내는 ‘측위’ 기술이 쓰인다. 원리는 간단하다. 카메라로 보이는 위치를 촬영하면 이미지 속의 선이나 점, 특정 구조물, 무늬 등을 인지해 만들어 둔 디지털 트윈과 비교해 현재 위치를 찾아내는 원리다. GPS 신호가 없더라도 실내에서 층수 까지 파악할 수 있는 구조다. 위치 오차범위는 10㎝에 불과하다.

다음이 안내의 영역이다. 나의 위치가 디지털 공간 상에서 확인된다면, 어디로, 어떻게 가야할 지가 파악된다. 공간 지능 기술이 미래 로봇의 길 안내를 담당할 수 있는 이유다. 이동환 네이버랩스 비전기술 리더는 “매핑을 해둔 공간이라면 GPS 여부와 상관없이 로봇도 10㎝ 단위로 위치를 파악하고 공간을 인지할 수 있는 곳”이라며 “공간 지능은 결국 로봇 시대의 눈과 뇌에 해당한다”고 말했다.

이에 만약 디지털 트윈으로 마련해 놓은 공간 데이터가 많다면 그만큼 공간 지능을 이용한 서비스 범위도 넓어질 수 있다. 특히 이같은 기술은 라이다 등 별도의 장치가 필요없이 카메라 만으로 구현된다. 넓은 디지털 트윈을 확보할 수록 국내에서 피지컬AI를 구현하는 비용이 절감되는 셈이다. 공간 지능이 국내에서 피지컬 AI가 확산되는 속도와 범위를 끌어올리는 인프라 역할을 할 수 있는 이유다. 네이버는 이미 서울시를 비롯한 수도권 전체에 대해 2차례에 걸쳐 디지털 매핑을 완료한 상태다. 이 리더는 “3차원 공간 데이터는 2D 지도를 능가하는 중요성을 가지고 있다”며 “일종의 데이터 주권의 관점으로 볼 수 있다”고 강조했다.

공간을 매핑하기 위해 전용 장비로 촬영하면 3D로 공간의 깊이 등을 인식해 3D 데이터로 저장된다. 네이버

공간AI는 韓이 선도…네이버, ‘더스터’ 발표했더니 구글은 ‘몬스터’, 메타는 ‘패스터’…

네이버는 이 과정에서 쓰인 기술을 자체 연구를 통해 쌓아 보유하고 있다. 촬영 장비부터 AI 파운데이션 모델 개발, 학습까지 네이버가 직접 개발해 이른바 ‘풀스택’ 기술을 보유하고 있다. 이 리더는 “필요하다면 곧장 상황에 맞게 장비, 소프트웨어를 즉시 최적화할 수 있다는 의미”라고 설명했다. 실제로 네이버가 롯데월드의 3차원 지도를 만드는 데 걸린 시간은 10시간에 불과하다. 코엑스 지도는 7일에 모든 작업이 완료됐다. 위치 인식의 정확도와 속도 등 완성도는 2019년 이후 국제 학술 대회에서 4차례 이상 1위를 차지할 정도다. 네이버의 공간지능 기술이 세계적으로 선도적 지위에 있다고 평가받는 이유다.

특히 네이버의 공간지능 AI모델 ‘더스터’는 생성형 AI로 따지면 ‘GPT’ 수준의 입지를 구축하고 있다. 네이버 ‘더스터’는 몇 장의 이미지로 3D공간을 구축해주는 AI 기술이다. 네이버는 지난해 학계에서 ‘더스터’를 발표했고, 이후 반향을 일으켜 현재 ‘몬스터(구글)’, ‘패스터(메타)’, ‘라이터(엔비디아)’ 등 글로벌 기업들이 더스터를 벤치마킹해 후속 연구를 진행하고 있다. 작명부터 더스터의 끝 부분을 딴 ‘-터’ 시리즈로 이어지는 등 공간지능 분야에서 하나의 장르로 자리잡을 정도다. 네이버 측은 “통상 공간지능 분야의 눈문이 인용이 많아야 100회 안팎이지만 더스터 논문의 경우 지난달 말 기준 730회가 인용됐다”고 전했다.

네이버가 자체 개발한 공간 AI 모델 '더스터'의 시연 영상. 여러 2D 이미지를 넣으면 AI가 이를 기반으로 디지털 3D 공간을 구축한다. 네이버

이같은 기술력은 엔비디아와 네이버가 공동으로 국내에서 피지컬AI플랫폼을 구축하기로 하는 결정적 기반이 됐다. 엔비디아는 AI칩을 한국 주요 기업에 공급하기로 하면서 네이버클라우드와 조선·바이오 등 국내 주요 산업현장에서 쓰일 피지컬AI플랫폼을 개발하기로 했다. 이때 네이버 측이 제공하는 주요 기술이 디지털트윈이다.

네이버랩스는 로봇이 일상화 됐을 때 로봇이 인간과 공존하기 위한 적절한 매너를 갖추는 기반도 공간지능에서 출발한다고 보고 있다. 이를 테면 로봇이 누워있는 주인의 배 위를 걸어가거나, 대화하는 두 사람의 사이를 뚫고 간다면 불쾌한 경험이 된다. 이 리더는 “로봇이 적절한 매너를 가지도록 하는 작업은 공간과 사물, 사람을 정확하게 인식하는 것부터 출발한다”며 “이는 공간지능 기술의 주요 요소”라고 강조했다.

네이버랩스는 로봇 외에 사람들도 공간지능 기술을 일상적으로 쓸 시점이 임박했다고 보고 있다. 바로 스마트글래스다. 구글, 애플, 삼성 등이 내놓는 AR 기기는 점점 바깥에서도 사용할 수 있는 스마트 글래스 형태로 진화할 것이란 전망이 크다. 만약 스마트 글래스가 보편화할 때 이용자가 시야에 보이는 아파트의 가격 정보를 묻거나, 상점의 판매 정보를 물었을 때 공간지능은 이를 인지하고 안내하는 기술적 기반이 된다. 이 리더는 “눈 앞의 공간과 위치를 인식하고 데이터베이스를 통합해 알려주는 형태가 우리가 보는 미래”라며 “공간 지능은 로봇을 위한 기술이면서 사람을 위한 미래의 필수 기술이 될 것”이라고 말했다.