음성 생성의 원리(Speech Production and Perception)

음성 생성(speech production)과 인지(speech perception)의 원리에 대해 알아보겠습니다. 사람이 대화를 할 때 말로 하죠. 말로 할땐 한사람이 어떤 생각을 하고 음성을 출력하고 다른 사람은 그 음성을 듣고 해석하는 과정을 반복하는 것이 대화이죠. 이 과정을 그림으로 그려보면 다음과 같습니다.

음성 생성과 인식의 도식화

음성의 생성과 인식 도식화
음성의 생성과 인식 도식화

 

A. Speech formulation : 할 말을 생각하고 머리속에서 떠올리는 단계

B. Human Vocal Mechanism : 사람의 조음기관을 이용해 음성을 만드는 단계

C. Acoustic Wave in Air : 공기를 통해 음성이 전달되는 단계

D. Perception of the Ear : 귀를 통해 소리를 듣는 단계

E. Speech Comprehension : 들은 내용을 머리로 이해하는 단계 입니다.

음성을 생성하고 인식하기 위해서는 할말을 머리로 생각을 한 후에 조음기관을 통해 소리를 만들어야 합니다.(B. Human Vocal Mechanism) 사람이 음성을 만들어내는 원리에 대해 자세히 알아보도록 합시다.

음성 생성의 원리

음성 생성 기관(좌), 음성 생성 원리(우)
음성 생성 기관(좌), 음성 생성 원리(우)

 

음성 생성 기관

폐, 성대(vocal folds), 성도(vocal trac), 입, 코 등이 음성의 생성에 관여합니다.

음성 생성 원리

폐에서 바람을 뿜어서 성대를 지나간다.(위의 오른쪽 그림) 성대의 열림(glottis)에 의해 소리(sound)가 생성되고 그 소리가 vocal tract(성도)등을 음성(speech)이 생성된다.

유성음(Voiced Sound)

성대가 팽팽하게 열려 있을 때 성대가 진동하며 주기성을 띄는 음성인 유성음(Voiced sound)가 생성된다. excitation 된 소리라고도 한다. 이렇게 만들어진 음성은 fundamental frequency를 가지며 음의 높낮이를 가진다. 주기성을 띄무로 사이클 한주기를 pitch라고 하는데 이 pitch를 보고 사람이 받아들이는 의미에서의 음의 높낮이를 알 수 있다. 풍선에서 바람이 나가는데 그 구멍을 쥐고 있으면 풍선에서 소리나는 것과 유사합니다.

무성음(Voiced Sound)

성대가 완전히 열려있을때는 바람과 같은 noise인 무성음(unvoiced sound)가 생성된다. 빨대를 불때와 유사합니다

Vocal Tract(성도)

Vocal Tract의 모양에 따라 vocal folds에서 생성된 소리가 ㄱ, 아, 으, ㅋ 등의 말로써 변형됩니다.(Filter 역할). Vocal Tract의 모양에 따라 excitation된 신호의 특정 주파수에서 magnitude가 많이 틔면서 ㄱ,ㄴ,ㄷ,아,야어 등의 발음이 만들어지는데 이 때 발음을 만들기 위한 주파수를 formant라고 합니다.

Reference

1. Schematic Diagram of the Speech Production/Perception Process [10].  | Download Scientific Diagram (researchgate.net)

https://doi.org/10.3389/fphys.2021.616985

Leave a Comment