Künstliche Grundfrequenzkontur für Elektro-Larynx-Sprache in Echtzeit-Simulation

Seminar Type: Speech Processing, Seminar (3 SE)
Student: Florian Pokorny

Zusammenfassung

Die Erzeugung von Sprachlauten durch den menschlichen Stimmapparat setzt die Lenkung eines Luftstroms voraus. Die Lunge als Luftquelle, die Luftröhre für den Lufttransport, der Kehlkopf mit den Stimmbändern2 als Signalquelle und der Vokaltrakt als akustisches Filter bilden die physiologischen Hauptkomponenten zur Sprachproduktion.

Stimmhafte Laute werden erzeugt, wenn der von der Lunge stammende Luftstrom durch die Vibrationen der Stimmbänder periodisch unterbrochen wird. Am Beginn einer jeden Periode ist die Glottis, der Bereich zwischen den Stimmbändern mittels deren Spannung weitgehend geschlossen. In weiterer Folge steigt der Luftdruck unterhalb der Glottis und zwingt diese zur Öffnung. In dem Moment, in dem die Stimmbänder durch Muskelerschlaffung auseinanderklaffen, steigt die Geschwindigkeit der Luft durch die Glottis und der lokale Luftdruck sinkt. Dieses Phänomen wird in der Strömungslehre als Bernoulli-Effekt bezeichnet. Anschließend können sich die Stimmbänder wieder spannen und der nächste Zyklus beginnt, vorausgesetzt der Luftstrom bleibt gegeben. Aufgrund der abrupten, periodischen Unterbrechungen des Luftstroms kann man für die resultierende, sehr obertonreiche Druckwelle dieses sich selbst aufrechterhaltenden Oszillators, die das Anregungssignal des Vokaltrakts darstellt, eine Grundfrequenz f0 = 1/T0 definieren, wobei T0 die Periodendauer beschreibt. Die Obertöne werden nun entsprechend des Frequenzgangs des Vokaltrakts spektral geformt.

Diese Art der Schallerzeugung nennt man Phonation. Die Variationsbreite der einzelnen, fungierenden Komponenten sorgt für eine große Vielseitigkeit des menschlichen Stimmapparats. So ist neben den durch ihre beweglichen Bestandteile Unterkiefer, Zunge, Gaumen und Lippen in Form und Abschluss veränderlichen Hohlräumen Rachen, Mund und Nase weiters die Stärke des Luftstroms, die sowohl Lautstärke als auch Tonhöhe des erzeugten Stimmklangs beeinflusst, weitgehend variabel. Die Tonhöhe wird außerdem von der Spannung der Stimmlippen bestimmt und kann auf diese Weise auch für verschieden starke Anblasdrücke gehalten werden.

Full Text & Additional Material

The bachelor thesis can be downloaded here.

AttachmentSize
BA_Pokorny_Larynx_Grundfrequenzkorrektur.pdf1.29 MB