과거 수십 년 전부터 현재까지 통계학, 더 나아가 통계학의 산출물이 사회의 전 분야에서 하나의 과학적 근거로 채택되고 있다. 웬만한 논문에는 거의 다 ‘통계를 통해서 분석하니 이러저러 하다’라는 결론으로 포장되어 있다. 또한 몇 년 전부터는 신문사, 방송사 할 것 없이 대부분의 미디어에서 시민들을 대상으로 정치, 경제 등 주요 안건에 대하여 설문조사를 한 후, 이 설문조사의 신뢰성을 확보하기 위한 장치로 신뢰수준이 어떻고, 표본오차가 어떠하다라는 표현을 삽입하고 있다. 이런 것들을 제시하지 않았던 과거의 설문조사 발표보다 조사의 신뢰성을 확보하는 것은 사실이지만, 통계학을 몇 년간 가르쳐온 나로서는 그런 행태가 곱게 보이지만은 않다. 마치 우리가 이렇게 고상한 용어로 설문조사 결과를 얘기하는 것이니 통계학을 모르는 당신들은 그저 믿어 의심치 말아라! 하는 것 같으니 말이다. 실제로 이 기사를 보는 사람들은 아마 이 용어들의 의미를 파악하지 못한 채, 조사 결과를 굳게 믿을 것이다. 그러나 우리들 중에 이를 이해할 수 있는 비율이 얼마나 될까? 통계학을 배운 학생들은 모두 이해하고 있을까?
이 세상에 세 가지 거짓말이 있다고 한다. 진짜 거짓말이 그 첫 번째이고, 다음으로 어쩔 수 없이 하게 되는 선의의 거짓말이 있으며, 마지막이 통계학이라는 것이다. 이제 우리가 왜곡되게 바라볼 수밖에 없는 사례를 들어 왜 통계학에 거짓말의 딱지가 붙은 것인지 먼저 말해보자. 80년대 금강산 댐을 왜 건설해야 되는지에 대하여 방송에서 난리가 났던 웃기지도 않은 시절이 있었다. 본인도 심장을 벌렁거리며 기부 행렬에 동참했던 금강산 댐의 건설! 아마 우리나라 국민 대부분의 심장이 벌렁거렸을 코미디가 TV 화면에 비친 통계 그래프로부터 시작되었던 것이다. 이 거짓말이 거짓말로 보이지 않아 많은 사람들의 심장이 벌렁거린 이유는 사람들에게 생소한 단어인 통계를 언급하며 강조했기 때문이라고 단언한다. 또 다른 간단한 예가 있다. 예전에 모 방송국의 스포츠 뉴스에서 한국과 미국의 프로 야구 진행 시간이 차이가 나는 이유를 설명하는 것을 본 적이 있다. 호기심을 갖고 지켜봤더니 그 이유로 하나의 통계치를 거론하고 있었다. 그것은 한국 선수 한 명과 미국 선수 한 명의 타석에서 하는 여러 행동들의 시간을 수치로 비교한 것이었다. 아쉽게도 이 뉴스는 사실이 아니다. 한국의 모든 선수가 그 선수처럼 행동하지도 않을 것이며, 미국 선수들의 경우도 같을 것이다. 통계학의 기본 원리에 반복의 원리라는 것이 있다. 이는 실험 오차를 염두에 두고 조사의 신뢰성을 높이기 위해 반드시 필요한 것이다. 댐의 건설에 빨간 거짓이 숨겨져 있다면, 야구 시간의 경우에는 반복의 원리를 위배하고 있는 거짓말이 숨겨져 있다.
이렇게 다 방면의 영역에서 다루고 있는 제3의 거짓말을 어떻게 받아들여야 할 것인가. 먼저 통계 또는 통계학을 통하여 얻은 결론이라는 것들을 조금 의심스러운 시선으로 바라볼 필요가 있을 것 같다. 물론 개중에는 진실스러운 보석들이 있는 것이 더 많다. 의심스러운 시선을 통하여 제3의 거짓말에서 올바른 진실을 골라보는 재미를 느끼기 위하여 통계학이란 무기를 스스로에게 장착해보는 것은 어떨까? 요즘같이 정보의 홍수 속에 사는 우리들은 그 정보들 중에서 뭐가 진실인지 한 번쯤 두드려보고 자신만의 결론을 얻어야 하지 않을까?
이메일로 받아보세요
지금 뉴스레터를 구독하세요.