현대사회는 가히 데이터의 홍수에 흘러가는 배와 같다. 다소 지나친 표현일 수는 있겠으나, 그 만큼 각 분야에서 쏟아져 나오는 데이터의 양은 시간의 흐름에 기하급수적으로 늘어 간다는 의미에서 충분히 수용될 수도 있는 표현으로 여겨진다. 조금 규모있는 회사의 한 사업장에서 생산되는 데이터의 양은 하루 1기가바이트(Gb)가 넘을 수도 있다. 이를 적시에 효과적으로 가공하여 의사결정을 위한 유용한 정보를 추출해내지 못한다면 그 기업은 그야말로 홍수에 떠내려 가는 돛도 달지 못하고, 노도 젓지 못하는 배의 형국이다.

최근 방대한 데이터를 효율적으로 가공 및 분석하여 기업이나 공공기관/조직의 전략적 의사결정에 유용한 정보나 지식을 생산해 내는 기술을 데이터 마이닝(data mining)이라 하며, 사회 각계에서 유용한 기술의 한 분야로 각광받고 있다.

 그런데 데이터를 처리하고 가공하는 사람들이 철칙으로 여기는 GIGO(Garbage In, Garbage Out)라는 말이 있다. 여기서 GIGO란 쓰레기가 들어가면 쓰레기가 나온다는 의미로서, 엉터리 데이터가 분석시스템에 들어가면 분석과정이 아무리 정교하다 할지라도 그 결과 역시 신뢰할 수 없을 뿐만 아니라 폐해까지 우려될 수 있다는 것이다.

 최근의 데이터베이스 기술과 데이터의 통계적인 분석시스템 그리고 통신 및 네트워크기술의 발달에 힘입어 방대한 데이터의 분석 및 처리시스템은 급속하게 발달하였다. 그러나 모든 일이 그러하듯이 첫 단추를 잘못 끼웠을 때, 그 결과는 무의미해 지는 경우가 허다하다.

 데이터의 신뢰성을 이야기할 때, 정확한 데이터와 정직한 데이터는 흔히 논의되는 주제이다. 정확한 데이터란 제대로 정의된 측정방법과 효과적인 측정시스템(이는 측정도구, 측정자, 측정환경 등의 요소를 포함한다.)의 구축을 통하여 얻어질 수 있다. 그러나 정직한 데이터란 측정에서 오류 또는 측정시스템의 정밀도에서 기인되는 것이 아닌, 측정자에 의하여 고의로 또는 무관심하게 왜곡/조작되는 것을 제도적으로 방지할 수 있어야 얻을 수 있는 것이다.

 이 중에서 특히 정직한 데이터는 데이터 생산자의 사명의식을 요구한다. 국가의 대계를 수립하는 과정에서 기초데이터가 부실하다면, 이에 기초한 계획의 수행과정에서 얼마나 많은 국민의 혈세가 낭비되겠는가. 우리는 얼마나 믿을만한 데이터에 기반하여 크고 작은 정책을 수립하고 있는지 자문해 볼 필요가 있다.

 산업현장에서 정확한 데이터에 대한 인식은 최근의 ISO 9000 품질경영시스템, 식스시그마 경영시스템, 전사적 자원관리(ERP) 등에서 측정과 과학적인 분석의 중요성을 강조함에 따라 상당히 개선되어지고 있다. 그러나 여전히 기업의 규모를 막론하여 정확하지 못하고, 정직하지 못한 데이터에 의하여 기업의 경쟁력이 떨어지는 사례를 자주 보게 된다.

 최근 IT(정보기술), NT(나노기술), BT(생명공학기술), ET(환경기술) 등의 분야가 첨단과학기술로 주목 받고 있다. 국가적으로 이들 분야에 막대한 예산을 지원하고, 특히 울산광역시를 포함한 지자체에서도 연구소, 벤처 및 창업보육센터에 환경기술을 포함하여 이 분야에 적지 않은 지원을 하고 있는 것으로 알려져 있다.

 그러나 이들 기술은 기본적으로 데이터과학(data science) 또는 DT(데이터 기술)에 기반하지 않으면 어려워 질 수 있다. 데이터과학은 독립적으로, 그리고 물리적인 실체를 가지고 있는 것은 아니지만 그야말로 모든 과학과 공학의 기초라고 할 수 있다. 이에 대한 중요성을 간과하고는 과학기술의 발전은 요원한 것이다.

 기업의 경쟁력은 데이터의 정확한 축적과 분석시스템 그리고, 이를 보다 효과적으로 활용하여 부가가치가 높은 지식의 생산으로 연결될 때 배가되는 것이며, 기업의 경쟁력이 곧 국가의 경쟁력이 되는 시대이다. 우리 사회는 그 어느 때보다 데이터에 근거한 과학적인 사고로 무장된 리더의 등장을 갈망하고 있다. 기업에서, 지방자치단체에서, 정당에서, 국가에서.

동서대학교 산업공학과 남 호수

 

저작권자 © 경상일보 무단전재 및 재배포 금지