|
국내 연구진과 미국 연구진이 공동으로 최소 10배에서 최대 100배 큰 용량의 데이터를 분석할 수 있는 대용량 다차원 분석 시스템을 개발했다.
강유 KAIST 교수팀은 14일 크리스토스 팔로웃소스 미국 카네기멜론대 교수팀과 공동으로 이같은 시스템을 개발했다고 밝혔다.
이번 시스템은 데이터나 기능을 여러 대의 기기에 분산해서 처리하더라도 큰 용량의 중간데이터가 생겨나는 기존 알고리즘의 단점을 극복했다. 기존 시스템은 데이터가 커짐에 따라 확장성이 떨어지는 한계가 있었다. 연구팀은 실제 이 시스템을 활용해 기존 방법으로 분해하기 어려운 9,900만 개의 지식으로 이뤄진 3차원 이상의 배열을 도출하는 데 성공했다.
강 교수는 “기존 방법으로 처리할 수 없었던 다차원 빅데이터를 효율적으로 분석할 수 있게 됐다”며 “이 시스템으로 소셜 네트워크, 지식 베이스, 네트워크 트래픽, 의료 데이터 등 다양한 분야의 빅데이터를 분석하는데 활용할 수 있을 것”이라고 말했다.
연구결과는 오는 4월 13일 서울에서 개최되는 데이터베이스분야 저명 국제학회, ‘국제전기전자학회 데이터공학 국제학술대회(IEEE ICDE)’에서 구두 발표할 예정이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >