[Tableau] 태블로 소개 & 데이터 종류

생각보다 데이터를 보면서 사람들 앞에서 발표해야 할 경험들이 많았고 시각화가 발표에 있어서 전달력을 높여줄 수 있는 도구라고 생각해왔다. 그래서 계속 공부할 생각만 하고 있었는데, 이번에 마침 BOAZ에 합격하여 태블로 시각화 툴을 다루게 되어 앞으로 태블로와 시각화에 대해서 정리해보고자 한다.

 

좋은 시각화

 

항상 시각화라고 다 좋은 시각화는 아니며, 비전공자도 살펴보면 한번에 이해할 수 있는 시각화를 어떻게 하면 만들어낼 수 있을까에 대한 고민이 있었다. BOAZ 시각화 세션을 통해 좋은 시각화에 대한 정의를 3가지로 정의할 수 있었다.

 

  • 수치, 통계적 결과만으로는 보이지 않는 패턴 파악이 가능한 시각화.
  • 전문적인 지식 없이도 쉽게 이해할 수 있는 시각화
  • 강력한 프레젠테이션을 통해 해당 정보의 영향력을 강화할 수 있는 시각화

==> 즉, 전달하고자 하는 분석 결과의 핵심 인사이트를 한 눈에 보여주는 시각화

 

필드 구분(차원 vs 측정값)

 

태블로를 데이터와 연결 시, 연결된 데이터의 필드를 차원과 측정값으로 구분한다.

 

  • 차원

차원의 경우, 우리가 측정값을 보는 관점으로 숫자들로 만들어진 차트를 어떻게 나눠서 볼 것인지를 결정하는 필드라고 보면 된다. 보통 정성적 값(이름, 날짜 지리적 데이터 등)으로 세부적인 정보를 표시할 때 사용한다. 데이터는 차원을 기준으로 분류할 수 있다.

 

  • 측정값

측정값의 경우 일반적으로 숫자 형식으로 차트를 만들기 위한 변수다. 측정할 수 있어야 하기 때문에 정량적인 수치(매출, 수량 등)로 집계할 수 있는 숫자 데이터이다. 집계 방식은 합계(SUM), 평균(AVG), 최댓값(MAX), 최솟값(MIN) 등 다양한 방식으로 집계할 수 있다.

 

연속형 vs 불연속형

 

눈치빠른 사람은 앞서 차원과 측정값의 인터페이스 색상이 다른 것을 눈치챘을지도 모르겠다.

이는 연속형(초록색)과 불연속형(파란색) 변수의 차이점이라고 볼 수 있다. 앞서 설명했던 차원의 경우는 정성적, 즉 불연속형 데이터이기에 파란색으로 표시가 되고 측정값의 경우 정량적, 즉 연속형 데이터이기 때문에 초록색으로 표시가 된 것을 확인할 수 있다.

그렇다고 차원 = 불연속형, 측정값 = 연속형이라고 판단해서는 안되며 상황에 따라서 다르게 판단해야 할 필요가 있다. (이건 계속 연습하면서 구분해나가야 할 것 같다.)

아래 예시에서 확인할 수 있다.