본문 바로가기
  • 상상을 통한 '새로운 혁명'의 시작
기타

사과와 오렌지 - 부적절한 비교

by 쟝파스타 2013. 6. 24.

 

 

 

 출처 : 엔하위키 미러 , 쿡쿡TV

 

 2000년도 전반기 6개월 동안 델라웨어에서 교통사고로 56명이 사망했다는 신문기사가 있었다. 분명 그 죽음들은 고인의 가족들과 친구들에게 비극이었다. 하지만 56이라는 숫자가 교통사고 사망자수로 대중의 관심의 초점이 될 만큼 큰 숫자였을까? 그 기사는 2000년도 전반기의 교통사고 사망자수 56명과 1999년도 전체의 104명을 비교하는 도표를 실었다. 이것은 만일 교통사고 사망건수가 2000년도 후반에도 같은 추세로 계속된다면 그 합계 - 사망자 112명 - 가 전년도보다 많아진다는 것을 의미했다. 그렇다면 56이라는 숫자는 문제가 커지고 있다는 증거가 될 수 있었다. 하지만 그 도표에는 또한 1997년도에는 148명 그리고 1998년도에는 116명이 교통사고로 사망했다고 나와 있었으므로 112명은 특별히 큰 숫자가 아니었다.

 

  이 예에서 우리는 따로 한 가지 숫자만 제시하는 단독 통계는 어떻게 해석을 해야 할지 알기 어렵다는 것을 알 수 있다. 56명의 교통사고 사망자수가 의미하는 것은 과연 문제가 커지고 있으므로 우리가 걱정해야 하는 일인가, 아니면 교통안전이 개선된 신호로 축하해야 하는 일인가? 56명이라는 숫자 하나만으로는 상황 판단을 하기 어렵다. 이 숫자를 이해하기 위해서는 다른 해에 델라웨어에서 있었던 교통사고 사망자수 합계나 아니면 다른 주와 비교를 해야 한다(델라웨어의 면적이 상대적으로 작은 것을 고려하는 방법을 찾을 필요가 있다. 예를 들어, 캘리포니아나 뉴욕보다 운전자가 적고 도로의 길이도 짧으므로 그만큼 교통사고도 적을 것이다).

 

  이러한 숫자 비교는 대부분의 통계를 이해하기 위해 필수적이다. 비교는 우리에게 상황판단을 할 수 있게 해준다. 분명한 비교를 통해 상황이 얼마나 변했는지를 측정하기 위해 서로 다른 두 시점에서의 통계(두 해의 교통사고 사망자와 같은)를 제시한다(물론, 사회문제에 대한 주장들은 보통 사태가 좋아지기보다는 점점 나빠지고 있다고 이야기한다). 또는 서로 다른 장소(다른 주나 다른 나라의 교통사고 사망률을 비교하는), 서로 다른 그룹(다른 나이나 인종 그룹의 교통사고 사망률을 비교하는) 또는 서로 다른 사회문제들(교통사고에 의한 사망자수를 다른 원인에 의한 사망자수와 비교하는)을 비교한다. 이러한 비교는 필요하지만 또한 엉터리 통계가 만들어지는 계기가 되기도 한다. "사과를 오렌지와 비교한다."는 익숙한 경구는 우리에게 부적절한 비교의 위험을 상기시켜준다.

 

  적절한 비교는 비교 가능한 항목들을 포함한다. 그들은 사과와 비교하고 오렌지를 오렌지와 비교한다. 비교 가능한 통계들은 같은 방법으로 같은 대상을 셈한다. 비교하기에 부적절한 통계 간의 비교는 혼동과 왜곡을 부른다. 따라서 어떤 통계학적 비교를 인정하기 전에 그 숫자들이 비교 가능한지 질문하는 것이 중요하다. 불행히도 비교 가능한 숫자들을 발견하는 것은 까다로운 일이 될 수 있다. 얼핏 보기에 적절해 보이는 비교도 알고 보면 심각한 결함을 갖고 있다. 비교 가능한 것처럼 보이는 많은 숫자들이 사실은 비교가 불가능한 것들이다. 얼핏 보기에는 모두 사과로 보여도 알고 보면 여러 가지 과일이 섞여 있는 수가 있다.

 

 조엘 베스트 (2001). Damned Lies And Statistics. 노혜숙 역(2003), 

<통계라는 이름의 거짓말> 무우수 106~107p 

반응형