BBED의 일반적인 transition의 평균과 공분산

논문 Reducing the Prior Mismatch of Stochastic Differential Equations for Diffusion-based Speech Enhancement (github 링크)에서 사용하는 SDE를 BBED(Brownian Bridge with Exponential Diffusion Coefficient) 라고 부른다. BBED는 아래와 같이 생겼다. 여기서 이고 는 noisy speech, 는 clean speech 가 어떻게 변하는지를 나타낸다. 가 주어질 때 BBED를 따르는 state 의 mean과 covariance는 아래와 같다. 여기서 이다. 여기서 … Read more

[논문간단리뷰] Score-Based Generative Modeling through Stochastic Differential Equations

Score-Based Generative Modeling through Stochastic Differential Equations 에 대해 리뷰해보겠습니다. 이번 글에서는 논문 “Score-Based Generative Modeling through Stochastic Differential Equations“에 대해 리뷰해보겠습니다. 이 논문은 확률미분방정식(Stochastic Differential Equation 이하 SDE)를 이용해서 데이터 샘플에 perturbation 을 주는 과정을 정의하고 그 반대과정인 perturbation 을 걷어내는 과정을 학습하는 방법을 제시하였습니다. 사실 이 논문에 대해서는 많은 리뷰들이 있습니다. 찾아보니 좋은 … Read more

[논문리뷰] Denoising Diffusion Probabilistic Models

Denoising Diffusion Probabilistic Models에 대해 리뷰하겠습니다. 안녕하세요. 이번에는 논문 Denoising Diffusion Probabilistic Models에 대해 리뷰해보겠습니다. Denoising Diffusion Probabilistic Models는 마코브 연쇄 (Markov chain)을 이용해서 데이터에 노이즈를 추가하는 과정을 표현하고 이 반대과정인 노이즈를 걷어내는 과정을 학습합니다. 지난 글에서 설명드린 논문 Generative modeling by estimating gradients of the data distribution 만큼 생성모델에서 중요한 논문입니다. 굉장히 의미 있는 … Read more

[논문리뷰] Generative modeling by estimating gradients of the data distribution

Generative modeling by estimating gradients of the data distribution 에 대해 간단히 리뷰해보겠습니다. 안녕하세요. 이번에는 논문 Generative modeling by estimating gradients of the data distribution에 대해 리뷰해보겠습니다. 이 논문은 데이터 생성과 관련해서 꽤 유명한 논문입니다. 아시는 분은 아시겠지만 이논문의 저자인 Yang Song 은 Score-Based Generative Modeling through Stochastic Differential Equations 논문으로 유명한 분이시지요. 이 논문 … Read more

[논문 개선 아이디어] Diffusion-Based Generative Speech Source Separation

Diffusion-Based Generative Speech Source Separation 개선 아이디어에 대해 이번에도 논문 개선 아이디어이다. Diffusion-Based Generative Speech Source Separation [1]에서 사용했던 Drift term 을 좀 더 일반화 할 뿐이다. [1]에서는 forward process를 아래와 같이 정의 했었다. Diffusion-Based Generative Speech Source Separation 에서의 Forward process 개선 아이디어 내가 하고자 하는 것은 SDE 식에 있는 를 상수로 사용하는 것이 … Read more

[논문식 유도 및 추가 아이디어] StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation

StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation의 핵심을 짚고 추가 아이디어 만들기 논문 StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation [1] (줄여서 StoRM)의 기본아이디어를 정리하고 추가적으로 StoRM 에서 제시된 공식들을 검증해보고 좀 더 일반화 해보겠다. StoRM 의 아이디어 StoRM 은 SDE프레임워크 하에서 score based model을 추정 하는 … Read more

Langevin Dynamics Sampling 이 의미 있는 이유

Langevin Dynamics Sampling을 하는 이유 Langevin Dynamics sampling이 생성모델에서 자주 보이는 것 같습니다. 왜 Langevin Dynamics Sampling 을 사용하고 있을까요? 아 그전에 Langevin Dynamics sampling이 뭔지부터 봐야겠죠. Langevin Dynamics Sampling이란? 내가 어떤 특정 로 부터 샘플을 생성하고 싶습니다. 그럴 때 아래와 같은 simulation 을 통해 로부터 데이터 샘플을 생성할 수 있습니다. 식 (1)에서 는 평균이 … Read more

[논문리뷰]Diffusion-Based Generative Speech Source Separation

Diffusion-Based Generative Speech Source Separation 논문리뷰 해보겠습니다. 랩세미나 시간에 논문 “Diffusion-Based Generative Speech Source Separation”에 대해 발표할 기회가 있어 발표내용을 정리해보려고 한다. 해당 논문은 네이버와 라인의 합작품이고, 연구실 선배이신 변재욱 박사님이 참여하신 논문이다. 논문정보: R. Scheibler, Y. Ji, S. -W. Chung, J. Byun, S. Choe and M. -S. Choi, “Diffusion-Based Generative Speech Source Separation,” ICASSP … Read more