[Tableau] 연습

[Tableau] Map

Simon Yoon 2022. 2. 10. 22:00

태블로를 활용한 시각화 중 유용하게 사용할 수 있는 지도(Map)에 대한 정리

 

교통사고 예시 데이터로 작성한 지도

태블로에서 지도를 그리는 것은 크게 어렵지 않다. 거의 대부분 태블로가 자동으로 잡아주기 때문에 원하는 형태를 손쉽게 얻을 수 있다. 작은 수정 사항들만 직접 작성해주면 된다. 위와 같은 지도를 그리기 위해 데이터에서 사용한 것은 교통사고 사망자수(Fatal), 광역시도(Address SD), 시군구(Address SGG) 데이터이다.

 

광역시도(Address SD)와 시군구(Address SGG) 데이터를 더블클릭하면 자동으로 지도가 작성된다. 하지만 각 행정구에 대한 설정이 '지리적 역할' 설정이 되어있지 않으면 지도에 반영되지 않으므로 지리적 역할에 체크해 주어야 한다. 광역시도는 지리적 역할에서 '주/시/도'로 체크하고, 시군구는 '시군구'로 체크하면 된다.

지리적 역할 변경 후 그려보면 아래와 같다.

위에 그려진 지도를 보면 오른쪽 아래에 '1개의 알 수 없는 항목'이 나와있다. 이 경우는 태블로에서 확인할 수 없는 지리적 위치이기 때문에 직접 수정해주면 된다. '위치 편집'에 들어가서 보니 창원시에 대한 항목이 창원시(통합)이라고 원본 데이터에 입력되어 있기 때문에 자동으로 인식하지 못했다. 이 때는 '인식할 수 없음' 자리에 직접 창원시 위치로 지정해주면 된다.

 

이제 지도는 그려졌으니 값을 올려보도록 하겠다. 사망자수(Fatal)를 '마크'에 '크기'로 올리면 왼쪽과 같은 형태로 발생 수가 많은 곳의 크기가 큰 형태로 그려진다. 다시 사망자수(Fatal)을 '색상'으로 올리면 동그란 점에서 각 구역별 색상 변화로 확인할 수 있도록 바뀐다.

위의 지도를 잠깐 살펴보자면, 왼쪽의 점 형태는 서울, 경기, 청주, 대구나 부산 정도에서 주로 발생하는 것 같은데 오른쪽 지도에서는 청주랑 창원에서 가장 많이 발생하는 것으로 보인다. 그러나 이는 지도의 표현방식이 바뀌어서 서울, 경기 전체가 아니라 각 시군구 수준에서는 청주나 창원 전체 보다는 사건 수가 적기 때문에 채도가 낮게 표시되는 것일 뿐 서울, 경기에서의 전체 사건 수의 변화는 없다. 따라서 리포트를 할 때는 대상이 오해하지 않도록 작성하는 것이 중요할 것이다.

 

이 데이터 셋에는 활용할 수 있는 차원이 여러개 있으므로, 한번 필터를 활용해 보도록 하겠다. 사고 유형 대분류(Type - Major Class)를 통해서 어떤 유형의 사고가 발생하였는지도 확인할 수 있다. 'Type - Major Class'를 필터 위에 올리면, 간단하게 사고 유형별 지역 현황을 확인 할 수 있다.

지도 with 필터

 

경도와 위도가 있다면 지도에 자세한 위치를 표시할 수도 있다. 이 데이터셋에는 사건 발생 위치에 대한 위도와 경도가 들어있는데, 이를 직접 열과 행에 올리면 한 지역 내에서도 자세한 사건 위치를 확인 할 수 있다. 다만 각 사건에 대한 고유값이 없어서 Index열을 만들어서 이용하였다. 참고로 아래와 같이 Index가 차원이 아닐 경우에 '차원으로 변환'으로 해준후 '마크' - '세부정보'에 Index를 올려주게 되면 정확한 지도 표시가 가능하다.


위의 오른쪽 화면을 보면 경기도 지역에서 2015년에 발생한 사고의 위치가 점으로 표시되어 있다. 이처럼 지도를 작성하게 되면 자세한 위치를 그려볼 수 있다. 예를 들어 각 지역에 있는 점포 위치 표시로도 활용할 수 있을 것이다.

 

분석에 사용한 데이터 셋은 공공 데이터에서 도로교통공단 제공 데이터를 활용하였다. 다만 원본 데이터와는 다르게 약간 변경하였다.

Child Car Accidents.csv
2.98MB