Phoneme list German (de

From Voice Technology Wiki
Revision as of 22:09, 11 December 2022 by 2001:16b8:1725:f600:2c27:6bd:4dc5:d59d (talk) (→‎Zusammenfassung: Fixed typo)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Die deutsche Lautsprache basiert auf dem Internationale Phonetische Alphabet(IPA) der "International Phonetic Association".

Im Gegensatz zu orthographischen Texten beschreibt diese die Lautbildung welche nötig ist um das Wort korrekt auszusprechen.

Die aktuellen IPA-Zeichen welche die Sprachlaute beschreiben, sind in der Liste der IPA-Zeichen aufgeführt.

Im Kontext der automatisierten Sprachsynthese besteht die Herausvorderung die typischerweise fehlenden Lautbildungsinformationen aufgrund des Orthographi basierten Inputs herzuleiten.

Typische Hindernisse:[edit | edit source]

unterschiedliche Zeichen führen zur selben Aussprache:[edit | edit source]

Beispiele:

"Das Event findet statt!"

"Ich gehe in die Stadt!"

gleiche Zeichen führen zu unterschiedlichen Aussprachen (Homophon):[edit | edit source]

Kontextbasierte Unterschiede[edit | edit source]

Beispiel:

"übersetzen"

im Sinne einer Sprachlichen Übertragung: https://www.duden.de/rechtschreibung/uebersetzen_dolmetschen_uebertragen

im Sinne einer Beförderung: https://www.duden.de/rechtschreibung/uebersetzen_befoerdern_ueberqueren

Je nach Kontext entsteht bei gleicher Orthographie eine unterschiedliche Aussprache und entsprechend unterschiedliche Zeichenketten der Lautsprache.

Eingebürgerte Fremdwörter[edit | edit source]

Teilweise werden Wörter aus anderen Sprachen 1:1 übernommen. Dessen Aussprache folgt dann üblicherweise nicht den typischen Regeln der deutschen Sprache.

Das Regelwerk für die deutschen Wörter wird in diesem Fällen zu einer falschen Phonemisierung führen.

Beispiel:

echauffieren -> das "ch" müsste in diesem Fall wie das "sch" behandelt werden, und das "au" ehr wie ein "oh".

Namen & Bezeichnungen

Namen weichen häufig von der Standardaussprache ab. Auch hier ist häufig die internationale Herkunft dafür verantwortlich.

Ohne Hintergrundwissen welches sich idR. nicht aus der Orthographie und auch nicht über den direkten Kontext ableiten lässt, ist eine Herleitung der korrekten Aussprache meistens nicht möglich.

Dialekte[edit | edit source]

Unterschiedliche Dialekte führen bei gleiche Orthographie zu unterschiedlichen Lauten. IdR. wird bei der Sprachsynthese auf die Hochsprache gesetzt, wodurch dieser Umstand bei TextToSpeech-Systemen ehr zu vernachlässigen ist. Allerdings im Fall der Namen und Bezeichnungen entspricht die korrekte Aussprache aus Sicht des Namensgebers sicherlich ehr der Form des Dialekts.

Zusammenfassung[edit | edit source]

Zusammengefasst lässt sich daraus ableiten, dass die Orthographi unterschiedlicher Sprachen & Dialekte unterschiedlicher Algorithmen erfordern, um zum richtigen Ergebnis zu führen.

Die Auswahl der passenden Algorithmen erfordert abseits der Standardfälle teilweise eine kontextbasierte Zuordnung der Worte und teilweise eine Zuordnung der Herkunft des Wortes.

In verhältnismäßig seltenen Fällen ist eine automatisierte Zuordnung ausgeschlossen -> dies Betrifft die speziell die Namen.