논문을 읽다가 데이터를 z-score normalization 하고 입력했다는 말을 보았다. z-score normalization 이 뭐인지 찾아봤는데 어려운것은 아니었다. 정규분포를 표준정규분포로 만들듯이 데이터의 평균이 0 분산이 1이되게끔 바꾸는 연산이 었다.
z-score normalization 설명
데이터 $x_1,x_2,x_3,…,x_n$이 있다고 하자. 여기에 z-score normalization을 적용한다는 것은 무슨 말일까 우선 평균과 분산을 구한다.
$$\mu = \frac{1}{n}\sum_{k=1}^n x_i$$
$$\sigma^2 = \frac{1}{n}\sum_{k=1}^n (x_i – \mu)^2$$
위와 같이 평균과 분산을 구한 후, $x_i$를 $z_i$라는 변수로 변환하는 것을 z-score normalization 이라고 말한다.
$$z_i = \frac{x_i – \mu}{\sigma}$$