Text to Speech (TTS) ist eine Form der Sprachsynthese, bei der Text auf einer Seite, z. B. einer Hilfedatei oder einer Webseite, in gesprochene Sprachausgabe umgewandelt wird. TTS kann zum Beispiel zum Lesen einer Textnachricht für eine fahrende Person oder zum Lesen der Computeranzeigeinformationen für eine sehbehinderte Person verwendet werden. Es kann jede textbasierte Nachricht in eine leicht verständliche verbale Nachricht umwandeln. Während TTS möglicherweise den emotionalen Ausdruck fehlt, den eine menschliche Stimme auf natürliche Weise erzeugt, ist die Sprachsynthese typischerweise sehr genau. TTS-Systeme können verwendet werden von:
- Studenten mit Legasthenie
- Leser unterwegs
- Multitasker wie ein Bäcker, der das Rezept vorlesen möchte
- Ältere Leser
- Sehbehinderte Leser
- Fremdsprachige Studenten
TTS vs. Sprachantwortsysteme
TTS sollte nicht mit Voice-Response-Systemen (VRS) verwechselt werden. Ein Sprachantwortsystem, auch als interaktive Sprachantwort bekannt, synthetisiert Sprache durch Verketten von Sätzen aus einer Datenbank von aufgezeichneten Wörtern und wird für einen anderen Zweck verwendet als ein TTS-System, das Sätze und / oder Phrasen basierend auf den Graphemen und Phonemen einer Sprache bildet.
Sprachantwortsysteme beschränken sich auf die Synthese von Sätzen, die nur Wörter enthalten, die vom System vorgegeben wurden. Im Gegensatz dazu sind TTS-Systeme theoretisch in der Lage, jede Folge von Textzeichen zu „lesen“, um ursprüngliche Sätze zu bilden.
Einfach ausgedrückt ist ein VRS eine aufgezeichnete Stimme, die abgespielt wird, wenn ein Anrufer anruft. Sie klingt wie eine menschliche Stimme, und diese Stimme bietet dem Anrufer Optionen, z. B. das Drücken einer bestimmten Nummer auf der Tastatur des Telefons, damit eine bestimmte Aktion ausgeführt wird . Ein VRS kann beispielsweise sagen: "Wenn Sie mit der Rechnungsabteilung sprechen möchten, drücken Sie bitte zwei." Nachdem zwei gedrückt wurden, wird der Anruf an die Abrechnungsabteilung weitergeleitet.
Ohne TTS-Systeme wäre VRS jedoch nicht verfügbar. TTS ist dafür verantwortlich, dem gesamten von einem VRS-Dienst geschriebenen Text eine Stimme zu verleihen. Für Unternehmen ist es von Vorteil, sowohl ein TTS-System als auch VRS zu haben. Mit einem TTS-System kann ein Unternehmen eine neue Bevölkerungsgruppe erreichen, zu der auch Menschen mit Sehbehinderung oder Leseschwierigkeiten gehören. Der Anruf kann in jeder Sprache aufgezeichnet werden, sodass Sprachbarrieren beseitigt werden. Mit der Kombination eines TTS-Systems und eines VRS kann ein Unternehmen Nachrichten sowohl im Audio- als auch im Textformat an Kunden senden, was eine bessere Konnektivität und schnellere Kommunikation ermöglicht.