대선과 관련한 조사의 일반적인 사항을 살펴 보면, 오는 12월19일 치러지는 16대 대통령선거의 20세 이상 유권자수는 3천511만8천636명(남 1천731만8천879명, 여 1천779만9천757명)인 것으로 밝혀졌다. 조사시점을 기준으로 각 후보의 지지율은 특정후보에 대한 총지지자수/총유권자수이다. 그러나 모든 유권자를 대상으로 지지후보를 조사하는 것은 시간과 비용 등 여러 가지 측면에서 무리이다. 따라서 부분(표본)에 기초한 지지율의 계산이 아닌 지지율의 추정이 필요한 것이다. 지지율의 추정은 부분의 대표성에 의하여 그 신뢰도가 좌우된다. 즉, 부분(유권자의 일부)의 선택에서 부분이 전체(총 유권자 집단)와 흡사하지 못하고 지역, 연령, 집단 등에 대한 치우침(편의)이 발생한다면 이에 근거한 지지율의 추정결과는 신뢰할 수 없을 뿐만 아니라 여론을 오도하는 등의 좋지 못한 결과를 가져 올 수도 있는 것이다.
분명한 것은 표본조사에서 지지율은 계산되는 것이 아니라 추측(추정)되는 것이며, 여기에는 다소간의 오차가 발생하는 것을 피할 수는 없다. 다만 합리적인 표본의 추출을 통하여 추정에서 발생되는 오차를 줄이고자 할 뿐이다. 지지율의 추정에서 오차를 줄이는 가장 간단한 방법은 보다 많은 유권자를 대상으로 조사를 하는 것이다. 그러나 이는 필연적으로 많은 시간과 비용을 요구한다.
그러면 최근의 언론에서 발표되는 지지율 조사결과는 어떠한가? 대부분의 조사는 유권자 가운데 극히 일부분인 1천명을 대상으로 이루어진 것이며, 물론 여기에는 조사결과에 대한 신뢰를 담보할 수 있는 다양하고 과학적인 표본추출기법이 적용되었으리라 믿어진다. 만약 1천명을 대상으로 조사한 결과에서 어떤 두 후보에 대한 지지율 추정값의 차이가 2%로 나타났다고 할 경우, 이 차이가 의미있는 차이인가. 통계적 이론에서 통상 신뢰수준 95%에서 오차한계의 계산은 비율에 대한 표준오차의 최대값을 기준으로 하는데, 예를 들어 1천명을 대상으로 지지율을 조사한 경우에 95%신뢰수준에서 지지율에 대한 오차한계는 3.1%로 계산된다. 즉, 어떤 후보에 대하여 30%의 지지율이 추정되었다면 그 후보의 실제 지지율은 26.9%에서 33.1%에서 변화할 수 있으며, 이 변화의 한계에 대한 신뢰도는 95%로서, 이 또한 절대적인 것은 아니다. 통상 지지율의 차이가 오차한계 범위내에 있을 때, 그 차이를 통계적으로 의미없는 차이라고 한다.
그러면 유의한, 즉 의미있는 차이란 무엇을 의미하는가? 통계학에서 "유의"는 어떤 사건 또는 결과가 우연하게 발생하지 않았음을 의미한다. 따라서 "유의성이 없다" 또는 "유의한 차이가 없다"고 하는 것은 지지율의 차이가 어떤 의미를 지니기 보다는 우연적으로 발생했을 가능성이 높다고 판단하는 것이다.
오늘도 어디에선가 조사가 진행되고, 그 결과에 1%만 차이가 나도 그 의미없는 차이를 쫓아 이리저리 쏠리는 무리를 보면서, 지도자로서의 자질과 비젼에 무관하게 의미없는 차이에도 애써 의미를 부여하고자 하는 사람들에게 안타까움을 느낀다. 진정한 의미있는 차이는 후보의 됨됨이와 정견과 효율성과 효과성이 극대화된 조직에서 나온다.