빅데이터가 비즈니스 세계의 상식이 되면서 전문가를 자처하는 사람 누구나 통계를 해석하고 인용해야만 할 것 같은 시대가 됐습니다. 우리가 접할 수 있는 통계 데이터 중 가장 대표적인 것이 바로 경제성장률을 비롯한 시장 지표들인데요. 이 수치들은 주로 한국은행을 비롯해 계량경제학을 연구하고 자료를 생산할 수 있는 기관에서 만듭니다. 단순히 ‘숫자’를 다루는 일이라기보다는 다양한 경제적 정황과 데이터 범위의 한계 등을 반영해서 가공하고 보정한 결과가 지표로 발표됩니다. 한국은행의 박양수 팀장은 <경제전망의 실제>라는 저서를 통해서 경제 지표에 반영되는 기초 데이터 뿐만 아니라 그것들을 만들어 가는 과정을 알기 쉽게 표현하려고 노력했던 것으로 유명합니다.
그런데 정말 통계가 진실 그 자체라고 볼 수 있는 것일까요? 얼마 전 중국의 리커창 총리는 자신들의 경제성장률 산정 방식에 오류가 있을 수 있다는 것을 한 매체와의 인터뷰를 통해 우회적으로 인정하기도 했습니다. 야담처럼 들려오는 말이지만 중국 사회에서 경제성장률이 7% 이하로 떨어지는 것은 체제 교란의 신호라는 이야기가 있습니다. 기본적으로 통계는 ‘객관화’를 위한 수치입니다. 그런데 국가 조직 내부의 안정, 또는 효과적인 도구로 기능하기 위해 결과를 왜곡하는 일이 현대 사회에서 벌어지고 있다는 것입니다. 물론 기초 자료를 조작하지는 않을 겁니다. 그러나 통계학 전문가들은 가중치를 제멋대로 부여하거나 측정 모형을 바꾸는 ‘합법적인 방식’을 통해 얼마든지 원하는 수치를 도출해낼 수 있다고 지적합니다. 쉽게 데이터 조작이 가능하다는 것이죠. 이를 어떻게 절차화하고 합리화하는가는 오직 전문가들만이 알 수 있기 때문에 수리 모델링(modeling)에 밝지 않은 일반인들은 저변을 이해하기 어렵습니다.
시청률 데이터도 타당성이 의심스러운 자료로 도마에 올랐습니다. 얼마 전 정부는 통합 시청률 산정 방식에 대해 방송사들이 대책을 내놓을 것을 권유했는데요. 기본적으로 해당 프로그램뿐만 아니라 개별 방송사의 평균 시청률을 측정함으로써 경쟁력을 평가하겠다는 의도였습니다. 그런데 문제는 기존의 시청률 산정이 방송사나 리서치 회사가 특정 패널만을 꾸려 TV 수상기에 설치한 기기를 바탕으로 이루어져 왔다는 것입니다. 방송사 근처 지역의 시청률이 대한민국 전역의 시청률인 것처럼 비친다는 지적도 있었죠. 이런 ‘샘플링의 한계’가 데이터 자체의 신뢰성을 떨어뜨린다는 비판이 고조되면서 빅 데이터 분석법을 활용해야 한다는 이야기까지 나옵니다. 스마트폰으로 지하철이나 버스에서 해당 프로그램을 보거나 파일을 다운받아 보는 시청자들이 집계되지 않는 점 역시 한계로 꼽힙니다.
이쯤 되면 통계를 무조건 중립적이고 과학적인 도구라고만 볼 수 없습니다. 숫자 자체는 매우 엄정하고 정확한 자료지만, 기초 수치를 어떻게 가공하느냐, 조사의 대상을 어떻게 잡느냐, 그리고 결과를 어떻게 해석할 것이냐에 따라 그 방향이 달라질 수 있기 때문입니다. 일련의 문제들을 해결하기 위해서는 우선 전문가가 나서야 합니다. 일반인도 쉽게 통계를 보고 이해할 수 있도록 도와줄 필요가 있는 것이죠. 통계는 신화가 아닙니다. 앞서 언급했듯 사람의 힘으로 얼마든지 생산 방식과 적용 방식이 바뀔 수 있기 때문에 과정과 결과에 대한 렌즈가 제공돼야 합니다. 어느 외국계 금융사의 한국인 임원이 자신의 블로그를 통해 열심히 외쳤던 구호가 생각납니다. ‘당하지 않으려면 우리 모두 금융을 공부해야 합니다. 금융에는 음모가 없습니다. 알아야 잘못된 판단을 하지 않습니다.’ 마찬가지로 통계도 그런 것이 아닐까 생각해 봅니다. 통계 자체가 중요한 것이 아니라 그것이 어떤 형태의 사회적 합의로 작동하느냐가 중요할 것입니다. 데이터를 통한 산업 경쟁력 강화 방안은 ‘모두가 알 수 있는 통계 렌즈’ 제공에서 발견될 테니까요.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >