K-dimensional unit simplex

K-dimensional unit simplex에 대해 알아보자. 기호로는 라 쓴다. 아래와 같이 정의한다. 이라고 하면 는 event가 K개인 사건에 대한 probability mass function이다. 즉 는 probability mass function의 모임이라고 보면된다.  

[딥러닝] 어텐션? attention?

라는 것이 있다고 하자. 는 feature dimension, 은 token 갯수이다 token은 정하기 나름인데 한문장에서 그 문장을 구성하는 단어의 갯수 정도로 생각하자. 개의 token이 어떤 관계에 있는지 보기 위해 attention을 사용한다. 아래와 같이 아주 간단히 표현된다.

GIST, 플로우 매칭 기반 음성향상 모델의 성능 및 속도 개선

신종원 교수 연구팀 플로우 매칭 기반 음성향상 모델의 추론 및 학습 방법을 추가하여 성능 및 속도 개선 광주과학기술원 전기전자컴퓨터공학부 신종원 교수 연구팀은 최근 플로우 매칭 (flow matching) 기반의 음성향상 모델의 속도 및 성능을 개선할 수 있는 학습방법 및 추론방법을 개발하였고 국제 음성신호처리 학회인 Interspeech 2025에 논문을 출간하였다. (논문링크: Speech Enhancement based on cascaded two flows … Read more

Interspeech 2025 후기 및 논문 공유 Generalizable Audio Deepfake Detection via Hierarchical Structure Learning and Feature Whitening in Poincaré sphere

Interspeech 2025 후기 및 논문 공유 Generalizable Audio Deepfake Detection via Hierarchical Structure Learning and Feature Whitening in Poincaré sphere 이성규_interspeech2025_report_20250905

Diffusion, Flow matching seminar (2025.08.26-2025.08.29)

Day 1 – Denoising Diffusion Probabilistic Models August 26, 2025 (Tuesday) EECS B205 13:00-15:00 Day 2 – Score-Based Generative Modeling through Stochastic Differential Equations August 27, 2025 (Wednesday) EECS B201 13:00-15:00 Day 3 – Flow matching for generative modeling August 28, 2025 (Thursday) EECS B202 13:00-15:00 Day 4 – FlowSE: Flow Matching-based Speech Enhancement (ICASSP … Read more

[논문리뷰세미나] Score-Based Generative Modeling through Stochastic Differential Equations

[발표자료_1]이성규_Score-based generative modeling through stochastic differential equations [발표자료_2]이성규_Score-based generative modeling through stochastic differential equations [발표자료_3]이성규_Score-based generative modeling through stochastic differential equations

Ensemble knowledge distillation of self-supervised speech models 요약

Ensemble knowledge distillation of self-supervised speech models 요약 논문 정보 논문 제목: Ensemble Knowledge Distillation for Self-Supervised Speech Models 저자: Kuan-Po Huang, Tzu-hsun Feng, Yu-Kuan Fu, Tsu-Yuan Hsu, Po-Chieh Yen, Wei-Cheng Tseng, Kai-Wei Chang, Hung-yi Lee 논문 요약 이 논문은 음성 관련 self-supervised learning (SSL) model 인 HuBERT, RobustHuBERT 그리고 WavLM 을 동시에 이용하여 knowledge … Read more