[논문리뷰] Ensemble knowledge distillation of self-supervised speech models 요약
Ensemble knowledge distillation of self-supervised speech models 요약.pdf
Ensemble knowledge distillation of self-supervised speech models 요약.pdf
SV56 사용 결과 비교.pdf
Contributions of “A Statistical Model-Based Voice Activity Detection.pdf
Contribution of “PEFAC – A Pitch Estimation Algorithm Robust to High Levels of Noise”.pdf
Contributions of “Speech enhancement using a minimum-mean square error short-time spectral amplitude estimator”.pdf
[논문리뷰] Modifying Flow Matching for Generative Speech Enhancement.pdf
신종원 교수 연구팀 플로우 매칭 기반 음성향상 모델의 추론 및 학습 방법을 추가하여 성능 및 속도 개선 광주과학기술원 전기전자컴퓨터공학부 신종원 교수 연구팀은 최근 플로우 매칭 (flow matching) 기반의 음성향상 모델의 속도 및 성능을 개선할 수 있는 학습방법 및 추론방법을 개발하였고 국제 음성신호처리 학회인 Interspeech 2025에 논문을 출간하였다. (논문링크: Speech Enhancement based on cascaded two flows … Read more
Microphone Array Processing for Distant Speech Recognition: From Close-Talking Microphones to FarField Sensors.pdf
광주과학기술원(GIST) 전기전자컴퓨터공학과 신종원 교수 연구팀은 디퓨전 (diffusion) 기반 음성향상 모델의 느린속도를 가속화하는 “플로우 매칭 (flow matching) 기반의 음성향상 모델” 기술 개발을 완료하였다. 기존의 디퓨전 모델은 음성향상을 위해 60번의 함수 호출이 필요했지만, 신종원 교수 연구팀은 플로우 매칭 기술을 사용하여 60번의 1/12 수준인 5번의 호출로 기존 디퓨전 기반의 음성향상 모델이나 fine tuning된 모델과 동등한 성능을 보였다. 플로우 … Read more