Barrierefreiheit: „Personal Voice“ + „Live Speech“

Rund 15 Minuten dauerte das Einsprechen von vielen zufälligen, englischsprachigen Sätzen; mein iPhone 13 (auf iOS 17 Beta 1) benötigte zur lokalen Erstellung der persönlichen KI-Stimme im Anschluss rund 20 Stunden.

Dabei musste das Telefon dauerhaft am Strom hängen. Aktivierte man den Bildschirm, informierte eine Benachrichtigung, dass das Training fürs eigene Stimmmodell pausiert wurde.

2x Screenshots der Einstellungen für die iOS-Bedienungshilfen.

Die Sätze wirken willkürlich zusammengewürfelt. Das sind sie natürlich nicht, aber sie gestalten das Einsprechen als durchaus herausfordernd.

Erkennt das iPhone ein Satzende (oder eine lange Pause), springt automatisch die nächste Phrase auf. Der gefühlte Zeitdruck ist allerdings nicht gegeben: Die Aufzeichnung lässt sich jederzeit pausieren; man kann immer Sätze neu aufnehmen oder zu den vorherigen Textaufforderungen zurückkehren.

iPhone-Screenshot, der die Live-Speech-Funktion zeigt.

Die so erzeugte, eigene Stimme lässt sich ausschließlich über die Bedienungshilfe „Live Speech“ benutzen. Dafür drückt ihr dreimal die Seitentaste und tippt euren erwünschten Text. Dieser wird anschließend über die iPhone-Lautsprecher vorgelesen.

Vimeo

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von Vimeo.
Mehr erfahren

Video laden

PHA+PGlmcmFtZSBsb2FkaW5nPSJsYXp5IiBzcmM9Imh0dHBzOi8vcGxheWVyLnZpbWVvLmNvbS92aWRlby84MzQ0MDM1MDE/ZG50PTEmaD1jNjE5ZDgzMzE2IiB3aWR0aD0iNjQwIiBoZWlnaHQ9IjM0MyIgZnJhbWVib3JkZXI9IjAiIGFsbG93ZnVsbHNjcmVlbj0iYWxsb3dmdWxsc2NyZWVuIj48L2lmcmFtZT48L3A+

Das Ergebnis besitzt die deutliche Charakteristik meiner Stimme. Niemand würde mich nach diesem ersten Anlauf jedoch verwechseln.

Das ist hier aber auch nicht das Ziel: Die eigene Stimme ist ein wichtiges Merkmal der Identität. Wem krankheitsbedingt ein Verlust der Sprachfähigkeit droht, sichert sich einen Teil seiner Individualität.

Das einmal trainierte Audiomaterial kann nicht ein zweites Mal den Machine-Learning-Prozess durchlaufen; man kann jedoch ein ZIP-Backup erstellen (zirka 100 Megabyte) und weitere Stimmen anlegen. Diese Stimm-Klone stehen dann auch auf euren anderen Geräten zur Verfügung.