태블로는 다양한 필터를 가지고 있다.
필터를 통해 다양한 인사이트 추출이 가능하며, 동적으로 바로바로 확인할 수도 있다. 그만큼 태블로에 있어서 필터는 중요하기 때문에, 한번 정리해보고자 한다.
아래 예시는 모두 Sample SuperStore를 사용하였다.
필터의 종류
태블로에서는 추출 필터, 데이터 원본 필터, 차원 필터, 측정값 필터, 컨텍스트 필터, 테이블 계산 필터의 총 6가지 필터를 이용할 수 있다.
필터의 작동 순서는 아래와 같으며, 추출 필터가 가장 우선적으로 작동하고 테이블 계산 필터가 가장 나중에 사용됨을 확인할 수 있다. 눈치가 빠른 사람은 알 수 있겠지만, 결국 필터의 사용 순서에 따라 결과도 달라진다는 것을 확인할 수 있다.
추출 필터
추출 필터는 데이터의 원본 소스에서 데이터의 일부분만 추출하고 싶을 때 사용하는 필터다.
예를 들어, 태블로의 Sample SuperStore의 원본 데이터가 존재할 때, 여기서 특정 조건을 가진 데이터만 따로 추출하여 분석을 진행하고 싶을 때 사용한다. 이는 데이터 불러오기에서 추출 > 편집으로 들어가면 필터 추가를 통해 추출 필터 실행이 가능하다. (추출된 데이터는 별개로 저장한다)
데이터 원본 필터
데이터 원본 필터는 데이터 원본에서 원하는 부분만 보고자 할 때 사용하는 필터다.
이는 데이터를 불러올 때부터 전체 데이터 중 일부 데이터만 끌어오는 경우에 적용하는 필터다.
기능적으로는 추출 필터와 데이터 원본 필터는 크게 구분되지 않으며, 두 필터 모두 화면 작업 이전에 적용되는 필터로 화면을 만드는 과정에서는 추출 필터가 걸려있든 데이터 원본 필터가 걸려있는 크게 다를게 없다. (더 자세히 알고 싶으면 LINK)
차원 필터
차원 필터는 데이터 유형 중 차원을 필터링하는 필터로 마크카드 위에 필터칸에 차원을 드래그 하는 경우를 '차원 필터'라고 한다.
예를 들어, 열에 들어있는 sub-category 차원을 필터창에 드래그하면 sub-category 필터창을 확인할 수 있다. 하나의 차원에서 여러 항목 중, 표시하고 싶은 항목을 선택하여 시트에 나타낼 수 있다.
(필터에 들어가 있는 차원을 우클릭 한 후, 필터 표시를 통해 우측에 각 항목을 선택할 수 있도록 표시할 수 있다.)
측정값 필터
측정값 필터는 차원 필터와 마찬가지로 데이터 유형 중 측정값을 필터링하는 필터로 차원 대신 측정값을 필터로 드래그한 경우를 의미한다.
여기서 주의해야 할 점으로, 드래그 후 뜨는 창이 기존의 차원 필터창과는 살짝 다르다는 것이다. 예를 들어, 행에 측정값인 Profit(합계)이 존재할 때, Profit 측정값을 필터로 넣어주게 되면 아래와 같이 필터 필드가 나오게 된다.
아래와 같이 합계를 눌러주게 되면, profit 합계의 최소-최댓값 범위를 확인할 수 있게 되며 이를 자유롭게 설정할 수 있다.
컨텍스트 필터
컨텍스트 필터의 경우 아래 브랜치 글을 인용한다.
태블로의 모든 필터들은 독립적으로 작동한다. 즉, 각 필터는 다른 필터들과 상관없이 데이터 원본 전체를 대상으로 각각 필터를 하는데, 컨텍스트 필터로 지정하게 되면 지정한 컨텍스트 필터가 데이터 원본 전체를 대상으로 필터를 먼저하고 필터된 데이터에서 다른 필터들이 필터를 하게 된다.
컨텍스트 필터는 작동 순서가 가장 앞 순서인 필터로, 데이터 원본 전체를 대상으로 가장 먼저 필터링을 하는 필터다.
컨텍스트 필터 같은 경우는 크게 두 가지 경우에 사용한다.
- 필터가 너무 많거나 데이터의 원본이 큰 경우
- 필터가 너무 많아 데이터(query)가 느려질 수 있다. 때문에 시각화 자체의 performance 향상을 위해 컨텍스트 필터를 적용한다.
- 상위 N필터
컨텍스트 필터의 예시를 들어보자.
필터에 Region과 Category를 드래그한다.
Region을 클릭하고 "컨텍스트 추가"를 클릭한다.
그러면 Region의 색상이 회색으로 바뀌면서 컨텍스트 필터가 적용이 된다.
컨텍스트 필터가 적용이 되면, 색상이 회색으로 바뀌고 필터 선반에서 제일 위에 나타나게 된다.
또 다른 예시를 들어보자.
아래와 같은 그래프를 만들어보자.
Sub-Category를 필터에 드래그 한 후, "상위"를 클릭하여 "필드 기준"을 체크하고 "상위", "10", "Sales", "합계"를 입력해보자.
그러면 Sales를 기준으로 한 상위 10개의 Sub-Category의 그래프가 나오게 된다.
이후 Category를 필터에 드래그하고 "Furniture"를 체크한 후 확인을 클릭하자.
그러면, 두 필드(Sub-Category, Category)로 필터된 3개의 Sub-Category의 그래프가 나오게 된다.
이 경우, 두 필드의 필터는 각각 적용이 되어 Sub-Category의 상위 10개와 Category중 Furniture에 해당하는 Sub-Category 사이에서 공통적인 Sub-Category만 필터되서 나오게 된다. 때문에, 총 3개의 Sub-Category의 그래프가 나오게 된다.
그러나, 만약 우리가 원하는 것이 Category가 Furniture인 조건에서, Sales가 가장 많은 상위 10개의 Sub-Category를 필터하는 것일 땐 "컨텍스트 필터"가 필요하다.
필터 선반에 있는 "Category: Furniture"를 클릭하고 컨텍스트에 추가를 클릭하자.
그러면, 'Category:Furniture'에 '컨택스트 필터'가 적용이 되어, 데이터 원본에서 Category가 Furniture인 것을 먼저 필터하고 나머지 데이터(Category가 Furniture인 데이터) 중에서 Sales가 가장 많은 상위 10개의 Sub-Category를 필터한다.
정리하면, Category가 Furniture에 속해 있는 Sub-Category의 수는 총 4개이고, 이 중에서 Sales가 가장 많은 상위 10개의 Sub-Category를 필터하기 때문에 최종 그래프는 다음과 같이 총 4개의 Sub-Category의 그래프가 나오게 된다!
계산된 필드의 경우, 상대적으로 중요한 필터이라고 생각하여 개별적으로 포스팅하도록 하겠습니다.
Reference
https://coding-potato.tistory.com/14
https://brunch.co.kr/@cheonmyung/70
https://brunch.co.kr/@cheonmyung/70
'Tableau' 카테고리의 다른 글
[Tableau] 날짜 형식의 연속형과 불연속형 데이터 (0) | 2024.07.21 |
---|---|
[Tableau] 태블로 소개 & 데이터 종류 (0) | 2024.07.21 |