Teager energy operator(TEO) features


음성(speech)를 이용해 감정인식을 하기 위해 어떤 speech feature를 사용하는지 중요하다. 감정 인식에서 사용되는 feature 중에는 Teager energy operator (TEO) features라는 것이 있다. 무슨 의미인지는 잘 모르겠지만 정리해보려고한다.

 

Teager energy operator(TEO) feature 정의

TEO feature는 어떤 연산에 의해 만들어지는 feature 이다.  $s[n]$을 speech signal이라고 하면 TEO는 아래와 같이 정의된다. 무슨의미인지는 잘 모르겠다.[1]

$$\phi[s[n]] = s^2[n]-s[n-1]s[n+1]$$

 

“TE operator는 잡음신호를 제거하여 잡음신호에 대한 음성 신호의 특성을 강화시켜줌으로써 잡음환경에서 효과적
인 음성검출을 위해 적용되는 알고리즘으로서 잡음제거 기나 잡음환경에서의 다양한 피쳐 파라미터들을 도출하는데 널리 사용되어 왔다”[2]

 

 

출처

[1] Youddha Beer Singh, Shivani Goel, A systematic literature review of speech emotion recognition approaches, Neurocomputing, Volume 492, 2022, Pages 245-263,

[2] 박윤식, 이상민, 잡음환경에서 Teager Energy 기반의 전역 음성부재확률을 이용하는 음성검출, 2012년 1월 전자공학회 논문지

Leave a Comment