확률변수, 확률벡터에 대해서는 많이 들어봤을것이다. 이것을 좀 더 일반화해서 확률 함수라는 것은 있을까? 있다. 확률벡터의 일반화된 버전이 바로 stochastic process (random process, 확률과정)이다. 이번에는 stochastic process 의 정의를 확률벡터의 연장으로써 생각을 해보고 좀 더 엄밀하게 정의해보자.
stochastic process의 가장쉬운 정의
stochastic process를 확률벡터의 일반화 버전으로 정의해보겠습니다. $T$를 $\mathbf{R}$, $[0,\infty]$,$[0,1]$등의 interval로 정의 합니다. 각 $t \in T$마다 대응되는 확률변수 $X_t$가 있다고 합시다. 이렇게 확률변수를 모아둔것 $\{X_t\}_{t\in T}$을 stochastic process 라고 합니다. 확률벡터가 $X$가 확률변수 $X_1,X_2,…,X_n$로 구성된것처럼 여러개의 확률변수로 구성된것이 stochastic process입니다.
stochastic process의 확률공간을 이용해서 정의
stochastic process를 확률공간을 이용해서 정의하겠습니다. 노테이션을 정리해보도록 하죠. 집합 $\mathcal{X}, \mathcal{Y}$이 있다고 합시다. $\Omega = \{ f | f : \mathcal{X} \to \mathcal{Y} \}$이라고 합시다. $\mathcal{X}$ 에서 $\mathcal{Y}$가는 함수의 함수를 모아둔 공간이죠. 이 $\Omega$에 확률측도 $P$가 있다고 합시다. 즉 $(\Omega, P)$는 Probability space를 의미합니다. 이럴 때 $f\in \Omega$를 stochastic process라고 부릅니다. 그러면 $\Omega$의 확률 $P$는 어떻게 표현할까요? 유한개의 $x_1,…,x_n$에서 $f(x_1),…,f(x_n)$값에 의해 정해집니다. 다음과 같이 $f$의 몇개 값이 가질 값에 대한 확률에 의해 $P$가 표현됩니다.
$$P( (f(x_1),…,f(x_n) ) \in B)$$
확률만 가지고 얘기하니까 좀 어렵죠. pdf나 pmf를 이용해 $f$의 확률을 정의할 수 있습니다.
$$P( (f(x_1),…,f(x_n) ) \in B) = \int_B p( (f(x_1),…,f(x_n) )) df(x_1)df(x_2)df(x_3)\cdot \cdot \cdot df(x_n)$$
정리
이번글에서는 stochastic process에 대해 정의하는 두가지 방법에 대해 보았습니다. 확률변수의 모임으로써 stochastic process를 정의하기도 하고 어떤 함수공간에 확률이 존재할때 그 공간의 원소(함수)를 stochastic process로 정의하기도 합니다. 이점을 기억하고 공부나 연구를 하면 오류를 범할일이 줄어 들것으로 예상됩니다.