Markovian measure와 Reciprocal class의 원소간의 KL divergence

Markovian measure와 Reciprocal class의 원소간의 KL divergence에 대해 알아보자. 특정 조건 하에서 KL divergence는 마치 피타고라스 정리가 성립하는 느낌을 준다. 정리해보자. 이라 하자. 일 때 아래가 성립하고 일 때 아래가 성립한다. 출처-Shi, Y., De Bortoli, V., Campbell, A., & Doucet, A. (2024). Diffusion Schrödinger bridge matching. Advances in Neural Information Processing Systems, 36.

Flow matching을 SDE로 해석해서 diffusion, drift term 구하기

요즘 Flow matching을 사용하고 있다. flow matching 논문에서는 t=0에서 쉬운 분포 t=1에서 데이터 분포로 두고 논의를 전개하지만 나는 t=0을 데이터 분포 t=1을 쉬운 분포로 두고 있다. 이렇게 했을 때 proability path의 mean과 covariance를 아래와 같이 만들어 냈다. 나는 speech enhancement를 하고 있기 때문에 아래는 는 clean speech를 의미하고 는 noisy speech 이다.

BBED의 일반적인 transition의 평균과 공분산

논문 Reducing the Prior Mismatch of Stochastic Differential Equations for Diffusion-based Speech Enhancement (github 링크)에서 사용하는 SDE를 BBED(Brownian Bridge with Exponential Diffusion Coefficient) 라고 부른다. BBED는 아래와 같이 생겼다. 여기서 이고 는 noisy speech, 는 clean speech 가 어떻게 변하는지를 나타낸다. 가 주어질 때 BBED를 따르는 state 의 mean과 covariance는 아래와 같다. 여기서 이다.

[논문간단리뷰] Score-Based Generative Modeling through Stochastic Differential Equations

Score-Based Generative Modeling through Stochastic Differential Equations 에 대해 리뷰해보겠습니다. 이번 글에서는 논문 "Score-Based Generative Modeling through Stochastic Differential Equations"에 대해 리뷰해보겠습니다. 이 논문은 확률미분방정식(Stochastic Differential Equation 이하 SDE)를 이용해서 데이터 샘플에 perturbation 을 주는 과정을 정의하고 그 반대과정인 perturbation 을 걷어내는 과정을 학습하는 방법을 제시하였습니다. 사실 이 논문에 대해서는 많은 리뷰들이 있습니다.

[논문리뷰] Denoising Diffusion Probabilistic Models

Denoising Diffusion Probabilistic Models에 대해 리뷰하겠습니다. 안녕하세요. 이번에는 논문 Denoising Diffusion Probabilistic Models에 대해 리뷰해보겠습니다. Denoising Diffusion Probabilistic Models는 마코브 연쇄 (Markov chain)을 이용해서 데이터에 노이즈를 추가하는 과정을 표현하고 이 반대과정인 노이즈를 걷어내는 과정을 학습합니다. 지난 글에서 설명드린 논문 Generative modeling by estimating gradients of the data distribution 만큼 생성모델에서 중요한 논문입니다. 굉장히 의미 있는

[논문리뷰] Generative modeling by estimating gradients of the data distribution

Generative modeling by estimating gradients of the data distribution 에 대해 간단히 리뷰해보겠습니다. 안녕하세요. 이번에는 논문 Generative modeling by estimating gradients of the data distribution에 대해 리뷰해보겠습니다. 이 논문은 데이터 생성과 관련해서 꽤 유명한 논문입니다. 아시는 분은 아시겠지만 이논문의 저자인 Yang Song 은 Score-Based Generative Modeling through Stochastic Differential Equations 논문으로 유명한 분이시지요.

[논문 개선 아이디어] Diffusion-Based Generative Speech Source Separation

Diffusion-Based Generative Speech Source Separation 개선 아이디어에 대해 이번에도 논문 개선 아이디어이다. Diffusion-Based Generative Speech Source Separation [1]에서 사용했던 Drift term 을 좀 더 일반화 할 뿐이다. [1]에서는 forward process를 아래와 같이 정의 했었다. Diffusion-Based Generative Speech Source Separation 에서의 Forward process 개선 아이디어 내가 하고자 하는 것은 SDE 식에 있는 를 상수로 사용하는 것이 … Read more

[논문식 유도 및 추가 아이디어] StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation

StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation의 핵심을 짚고 추가 아이디어 만들기 논문 StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation [1] (줄여서 StoRM)의 기본아이디어를 정리하고 추가적으로 StoRM 에서 제시된 공식들을 검증해보고 좀 더 일반화 해보겠다. StoRM 의 아이디어 StoRM 은 SDE프레임워크 하에서 score based model을 추정 하는 … Read more

Langevin Dynamics Sampling 이 의미 있는 이유

Langevin Dynamics Sampling을 하는 이유 Langevin Dynamics sampling이 생성모델에서 자주 보이는 것 같습니다. 왜 Langevin Dynamics Sampling 을 사용하고 있을까요? 아 그전에 Langevin Dynamics sampling이 뭔지부터 봐야겠죠. Langevin Dynamics Sampling이란? 내가 어떤 특정 로 부터 샘플을 생성하고 싶습니다. 그럴 때 아래와 같은 simulation 을 통해 로부터 데이터 샘플을 생성할 수 있습니다. 식 (1)에서 는 평균이 … Read more

[논문리뷰]Diffusion-Based Generative Speech Source Separation

Diffusion-Based Generative Speech Source Separation 논문리뷰 해보겠습니다. 랩세미나 시간에 논문 "Diffusion-Based Generative Speech Source Separation"에 대해 발표할 기회가 있어 발표내용을 정리해보려고 한다. 해당 논문은 네이버와 라인의 합작품이고, 연구실 선배이신 변재욱 박사님이 참여하신 논문이다. 논문정보: R. Scheibler, Y. Ji, S. -W. Chung, J. Byun, S. Choe and M. -S. Choi, "Diffusion-Based Generative Speech Source Separation," ICASSP