Mein Feature des Jahres: „Text-zu-Sprache“
„Text-zu-Sprache“ war mein AI-Feature im Jahr 2023; sagt auch die Statistik.
TTS – „Text-to-Speech“ ist per se nicht neu. Den Vorlesestimmen von Acapela, Ivona und NeoSpeech lauschte ich in den Jahren zuvor über den Voice Dream Reader. Allerdings nicht annähernd in dieser Qualität und mit einer Bequemlichkeit, die noch vor wenigen Jahren unvorstellbar erschien.
Und das ist noch stark untertrieben: Im Vergleich zu heute klingen die alten Stimmen monoton, beinahe leblos und wehe, ihr zieht am Hebel für die Sprechgeschwindigkeit. Moderne AI-Stimmen bereiten keine Kopfschmerzen mehr.
Allem voran bleibt das Feature eine unglaubliche Bedienungshilfe. Nicht nur für Personen mit Sehbeeinträchtigungen, sondern auch für alle, denen nach zweitausend Wörtern die Augen zufallen.
Vorgelesener Text ist enorm informationsdicht; ganz anders als Podcasts oder Hörbücher. Text, den man fürs Lesen verfasst, aber dann anhört, wirkt intensiv. Ich muss mich stärker konzentrieren, um den gespeicherten Webartikeln zuzuhören. Das klappt beim Sport, auf dem Fußweg zur Arbeit, aber nicht beim Aufräumen oder Autofahren.
Readwise, Omnivore und Matter bedienen diesbezüglich eine Zielgruppe mit gehobenen Ansprüchen. Eine rudimentäre Vorlesefunktion schlich sich aber schon über Safari ins System.
Über das iOS-Teilenmenü, respektive eine Browser-Extension, verfrachte ich (ausschließlich englischsprachige) Artikel zu Matter. Zicken Onlineseiten, hilft oft dieser Trick; andere Stolpersteine rollen so aus dem Weg.
In einem Jahr erwarte ich, meine eigene Stimme als „Unreal Voice“ in der „Später-Lesen“-App auswählen zu können. Vielleicht gibt es dann auch schon einen Play-Button über meinen iPhoneBlog-Artikeln.
Unreal Speech und Eleven Labs sind mir derzeit noch zu teuer, aber beschreiten bereits diesen Weg. Apples „Personal Voice“ zeigt zarte Anfänge eines Klons der eigenen Stimme.
AI hätte im Jahr 2023 den Titel „Person of the Year“ verdient gehabt. Jeder zog dort etwas Eigenes für sich raus – von ChatGPT über Whisper bis Midjourney. Für mich war es „Text-zu-Sprache“, das in diesem Jahr so richtig abhob.