[Data] 정규화(Normalization) / 표준화(Standardization)
거리 기반 알고리즘의 경우, 모델링 이전에 반드시 정규화 또는 표준화 작업이 필수적이다. 진짜 별거는 아닌데, 정규화와 표준화에 대한 개념이 중간중간 헷갈려서 다시 한번 제대로 정리해보고자 한다. 정규화(Normalization) 정규화는 데이터의 범위를 0부터 1까지로 변환하여 데이터의 분포를 조정하는 방법이다. 정규화의 경우 해당 값이 어떤 위치에 있는지 파악하는데 유용하다. 정규화의 종류는 min-max 정규화 방식이 자주 사용되는 방식이라고 할 수 있겠다. 수식은 아래와 같다. $$ x_{scaled}=\frac{x - x_{min}}{x_{max}-x_{min}} $$ 표준화(Standardization) 표준화는 각 관측치의 값이 전체 평균을 기준으로 어느 정도 떨어져 있는지를 나타낼 때 사용..