인포그래픽 크리에이터인 Ryan McCready에 따르면, 데이터 시각화로 독자를 기만하는 5가지 방법으로 아래와 같은 방법이 있습니다.
이런 일은 언론에서 많이 일어나지만, 논문에서도 종종 확인되는 현상이기도 합니다.
그림은 제가 새롭게 그려서 작성해봤습니다.
(1) 세로축에서 베이스라인을 생략하기
– 세로축을 베이스라인 (이 경우에는 0)이 아닌 다른 숫자로 시작할 경우, 같은 데이터로도 전혀 다른 메시지를 전달할 수 있습니다.
– 위의 그림에서는 같은 데이터를 쓰는데 왼쪽은 세로축을 50.0으로 시작하고, 오른쪽은 0으로 시작합니다.
– 왼쪽을 보면 Group A, B, C의 차이가 커보이지만 오른쪽을 보면 큰 차이가 없습니다.
(2) 세로축의 간격 바꾸기
– 세로축의 간격을 조절함으로써 작은 변화를 크게, 또는 큰 변화를 작게 보이게 할 수 있습니다.
– 위의 그림에서는 왼쪽에서는 10 단위로 끊어서 0-40으로 보이고, 오른쪽에서는 5 단위로 끊어서 0-15로 보입니다.
– 왼쪽을 보면 큰 변화가 없어 보이지만, 오른쪽을 보면 변화가 있어 보입니다.
SBS그래프: 커진 경기하강 ‘경고음’
하지만 정작 퍼센트로는 0.4, 변동치라는 것은 1.2포인트 감소
(3) 의도에 맞는 데이터 골라 사용하기
– 의도에 맞는 데이터만 골라서 사용하면 전반적인 추세와는 전혀 다른 정보를 전달할 수 있습니다.
– 왼쪽에서는 2020년 5월-8월까지의 데이터를, 오른쪽에서는 2019-2023년 데이터를 보여주고 있습니다.
– 왼쪽만 보면 전체적으로 상승하는 느낌이지만, 오른쪽을 보면 전체적으로 올랐다가 떨어지는 것을 알 수 있습니다.
(4) 잘못된 유형의 그래프 사용하기
– 시각화하고자 하는 자료의 유형에 맞지 않는 그래프를 사용하면 정보가 왜곡될 수 있습니다.
– 왼쪽에서는 파이형 차트를 사용하고 있고, 오른쪽에서는 막대형 차트를 보여주고 있습니다.
– 총합이 100%인 경우에는 왼쪽처럼 파이형 차트를 쓰는 게 맞지만, 그렇지 않고 비교할 경우에는 오른쪽처럼 막대형 차트를 쓰는게 맞습니다.
(5) 시각화의 관례에 역행하기
– 시각화에는 관례가 있습니다. 예를 들어 밀도가 낮으면 옅게, 높으면 짙게 시각화하는 방식이 있습니다. 이러한 관례를 따르지 않으면 독자들이 오해하기 쉽습니다.
– 왼쪽에서는 숫자가 증가할수록 옅어지게, 오른쪽에서는 숫자가 증가할수록 짙어지게 표현했는데 오른쪽 방식이 적합합니다.
실제사례 몇가지
김영란법 국회 통과 여론조사: 사실 이거는 그래프 복붙하면서 생긴 문제인거 같기는 하지만 7.3%라고 해도 너무 크게 표시한 것으로 보이는데, 그냥 3개 그래프가 치수와 관계없이 다 똑같다.
유명한 한겨레의 노무현 국정운영 여론조사 그래프 조작건
0.5+28.4 > 55.3 이라는 기적을 보여주고 있다.