GIST, 플로우 매칭 기반 음성향상 모델의 성능 및 속도 개선

신종원 교수 연구팀 플로우 매칭 기반 음성향상 모델의 추론 및 학습 방법을 추가하여 성능 및 속도 개선 광주과학기술원 전기전자컴퓨터공학부 신종원 교수 연구팀은 최근 플로우 매칭 (flow matching) 기반의 음성향상 모델의 속도 및 성능을 개선할 수 있는 학습방법 및 추론방법을 개발하였고 국제 음성신호처리 학회인 Interspeech 2025에 논문을 출간하였다. (논문링크: Speech Enhancement based on cascaded two flows … Read more

광주과학기술원 신종원 교수 연구팀 더 빠른 디퓨전 기반 음성향상 모델 개발

광주과학기술원(GIST) 전기전자컴퓨터공학과 신종원 교수 연구팀은 디퓨전 (diffusion) 기반 음성향상 모델의 느린속도를 가속화하는 “플로우 매칭 (flow matching) 기반의 음성향상 모델” 기술 개발을 완료하였다. 기존의 디퓨전 모델은 음성향상을 위해 60번의 함수 호출이 필요했지만, 신종원 교수 연구팀은 플로우 매칭 기술을 사용하여 60번의 1/12 수준인 5번의 호출로 기존 디퓨전 기반의 음성향상 모델이나 fine tuning된 모델과 동등한 성능을 보였다. 플로우 … Read more