BBED의 일반적인 transition의 평균과 공분산

논문 Reducing the Prior Mismatch of Stochastic Differential Equations for Diffusion-based Speech Enhancement (github 링크)에서 사용하는 SDE를 BBED(Brownian Bridge with Exponential Diffusion Coefficient) 라고 부른다. BBED는 아래와 같이 생겼다.

dx = \frac{y-x}{1-t}dt + g(t) dw

여기서 g(t) = \sqrt{c} k^t 이고 y 는 noisy speech, x 는 clean speech x_0 가 어떻게 변하는지를 나타낸다. x(0)=x_0 가 주어질 때 BBED를 따르는 state x(t) 의 mean과 covariance는 아래와 같다.

\tilde{\mu}(t,x_0, y) = (1-t)x_0 + ty \tag{mean} \tilde{P}(t, c, k) =\left( (1-t)c\left [(k^{2t}-1+t) + \log(k^{2k^2})(1-t)E(t,k)\right ] \right) \mathbf{I} \tag{covariance}

여기서 E(t,k)= Ei[2(t-1)\log(k)] -Ei[-2\log (k)]이다. 여기서 Ei 는 exponential integral을 의미한다.

그러면 x(s) = x_s 만 주어졌을 때 x(t) 의 mean과 covariance는 어떻게 될까? 약간의 노가다를 하면 아래와 같이 구할 수 있다.

\mu(t,x_s, y \mid s) = \frac{1}{1-s} \tilde{\mu}(t,x_s,y) - \frac{1}{1-s}\tilde{\mu}(s,0,y) P(t,c,k \mid s)= \tilde{P}(t,c,k) - \frac{ (1-t)^2}{(1-s)^2} \tilde{P}(s,c,k)

Leave a Comment