Prosodiegenerierung für die datenbasierte Sprachsynthese
Autoren
Mehr zum Buch
Sprachsynthesesysteme, die Bestandteil eines Sprachproduktionssystems, wie zum Beispiel telefonische Kontostandsauskunft, Autonavigation, Wetteransage und ähnlichem, sind, können davon profitieren, dass der zu sprechende Text nicht beliebig ist, sondern innerhalb des Systems generiert wird. So ist es bei Sprachproduktionssystemen möglich, prosodische Aspekte wie Akzentuierung und Phrasierung im Vergleich zu reinen Vorleseautomaten zu verbessern. Die vorliegende Dissertation schlägt dazu ein System vor, dessen Akzentuierungsstrategie mittels Verstärkungslernen trainiert wird. Insbesondere wird untersucht, welche Indikatoren für die Erzeugung prosodischer Marker geeignet sind. Am Beispiel eines Systems, das Weinsorten beschreiben und miteinander vergleichen kann, wird die Arbeitsweise näher erläutert. Die Gültigkeit der vorgeschlagenen Vorgehensweise wird anhand eines detaillierten Vergleichs zwischen Vorleseautomat und Sprachproduktionssystem sowie anhand einiger Hörtests bestätigt.