[경상시론]의미 없는 차이와 의미 있는 차이

일반적으로 통계적 추론은 부분과 전체의 문제, 즉 부분으로 전체를 추정하는 문제에서 발생할 수 있는 불일치를 줄이는 것을 목적으로 하는 과학적인 학문분야이다. 최근 연말의 대선과 관련하여 다양한 기관, 정당 및 단체에서 후보들의 지지율과 관련한 여론조사를 벌이고 있다. 조사결과만 달랑 제시하던 예전과 달리 요즘에는 표본의 설계 그리고 조사방법 및 과정 등에 관한 근거를 상당부분 제시하고 조사결과를 발표하는 형식을 취하여 결과에 대한 신뢰가 다소 높아진 것이 사실이다. 그러나 결과를 보고 해석하는 적지 않은 후보 및 정치인들의 사고는 단편적이기 짝이 없어 안타깝다.

　대선과 관련한 조사의 일반적인 사항을 살펴 보면, 오는 12월19일 치러지는 16대 대통령선거의 20세 이상 유권자수는 3천511만8천636명(남 1천731만8천879명, 여 1천779만9천757명)인 것으로 밝혀졌다. 조사시점을 기준으로 각 후보의 지지율은 특정후보에 대한 총지지자수/총유권자수이다. 그러나 모든 유권자를 대상으로 지지후보를 조사하는 것은 시간과 비용 등 여러 가지 측면에서 무리이다. 따라서 부분(표본)에 기초한 지지율의 계산이 아닌 지지율의 추정이 필요한 것이다. 지지율의 추정은 부분의 대표성에 의하여 그 신뢰도가 좌우된다. 즉, 부분(유권자의 일부)의 선택에서 부분이 전체(총 유권자 집단)와 흡사하지 못하고 지역, 연령, 집단 등에 대한 치우침(편의)이 발생한다면 이에 근거한 지지율의 추정결과는 신뢰할 수 없을 뿐만 아니라 여론을 오도하는 등의 좋지 못한 결과를 가져 올 수도 있는 것이다.

　분명한 것은 표본조사에서 지지율은 계산되는 것이 아니라 추측(추정)되는 것이며, 여기에는 다소간의 오차가 발생하는 것을 피할 수는 없다. 다만 합리적인 표본의 추출을 통하여 추정에서 발생되는 오차를 줄이고자 할 뿐이다. 지지율의 추정에서 오차를 줄이는 가장 간단한 방법은 보다 많은 유권자를 대상으로 조사를 하는 것이다. 그러나 이는 필연적으로 많은 시간과 비용을 요구한다.

　그러면 최근의 언론에서 발표되는 지지율 조사결과는 어떠한가? 대부분의 조사는 유권자 가운데 극히 일부분인 1천명을 대상으로 이루어진 것이며, 물론 여기에는 조사결과에 대한 신뢰를 담보할 수 있는 다양하고 과학적인 표본추출기법이 적용되었으리라 믿어진다. 만약 1천명을 대상으로 조사한 결과에서 어떤 두 후보에 대한 지지율 추정값의 차이가 2%로 나타났다고 할 경우, 이 차이가 의미있는 차이인가. 통계적 이론에서 통상 신뢰수준 95%에서 오차한계의 계산은 비율에 대한 표준오차의 최대값을 기준으로 하는데, 예를 들어 1천명을 대상으로 지지율을 조사한 경우에 95%신뢰수준에서 지지율에 대한 오차한계는 3.1%로 계산된다. 즉, 어떤 후보에 대하여 30%의 지지율이 추정되었다면 그 후보의 실제 지지율은 26.9%에서 33.1%에서 변화할 수 있으며, 이 변화의 한계에 대한 신뢰도는 95%로서, 이 또한 절대적인 것은 아니다. 통상 지지율의 차이가 오차한계 범위내에 있을 때, 그 차이를 통계적으로 의미없는 차이라고 한다.

　그러면 유의한, 즉 의미있는 차이란 무엇을 의미하는가? 통계학에서 "유의"는 어떤 사건 또는 결과가 우연하게 발생하지 않았음을 의미한다. 따라서 "유의성이 없다" 또는 "유의한 차이가 없다"고 하는 것은 지지율의 차이가 어떤 의미를 지니기 보다는 우연적으로 발생했을 가능성이 높다고 판단하는 것이다.

　오늘도 어디에선가 조사가 진행되고, 그 결과에 1%만 차이가 나도 그 의미없는 차이를 쫓아 이리저리 쏠리는 무리를 보면서, 지도자로서의 자질과 비젼에 무관하게 의미없는 차이에도 애써 의미를 부여하고자 하는 사람들에게 안타까움을 느낀다. 진정한 의미있는 차이는 후보의 됨됨이와 정견과 효율성과 효과성이 극대화된 조직에서 나온다.

경상일보 webmaster@ksilbo.co.kr

상단영역

1989년 5월 15일 창간

본문영역

[경상시론]의미 없는 차이와 의미 있는 차이

개의 댓글

댓글 정렬

내 댓글 모음