(WhatsApp-)Sprachnachrichten transkribieren

5. März 2022 – 20:50 Uhr

Das Thema lässt mich noch nicht los. Das ganz fantastische Just Press Record – das sich vor zwei Wochen ein dreispaltiges iPad-Layout leistete – verschriftlicht alle Audiodateien, die ihr in seinem iCloud-Ordner ablegt.

So etwas funktioniert dann beispielsweise auch für WhatsApp-Sprachnachrichten. Ein langer Druck auf empfangene Audiodateien führt in der Chat-App zur Option „Weiterleiten“ und anschließend ins Teilen-Menü (unten rechts).

Über „In Dateien sichern“ speichert ihr die M4a-Datei im „Just Press Record“-Ordner. Wenn ihr diese Datei dann in der Diktat-Software öffnet, drückt ihr ebenfalls lange mit dem Finger auf das File und wählt „Transkription“.

Über die „Just Press Record“-Einstellungen legt ihr die „Transkriptions-Sprache“ fest. Die Software benutzt Apples „Speech-to-text“-Feature, das bis zu 30 Sprachen versteht.

Die Erkennung ist hinreichend gut, um mindestens Stichwörter in allen Sprachnotizen zu suchen. Oft ist aber auch der gesamte Text absolut verständlich in Worte gefasst.

Apples „Sprache-zu-Text“-Funktion holpert jedoch (ausgerechnet) am eigenen Accessibility-Feature „Bildschirminhalt sprechen“ (➝ Bedienungshilfen ➝ Gesprochene Inhalte). Streicht man mit zwei Fingern vom oberen Bildschirmrand nach unten, liest iOS den Text auf dem Screen vor. Wenn ich das anstoße und ein zweites iPhone zur Aufnahme davor halte, erfolgt im Anschluss oft keine sinnvolle Transkription (obwohl die Aufnahmen sich für mich absolut verständlich anhören).

Das „Just Press Record“-Team vermutet, dass die Audioaufnahmen dieser synthetischen Stimme „not human enough“ klingen. Je nach Sprache und Text, kann es einen Unterschied machen, wenn man die Stimmen tauscht (➝ Bedienungshilfen ➝ Gesprochene Hinhalte ➝ Stimmen).

Anyway. Bei allen Diktaten, die tatsächlich Menschen einsprachen, klappte dieser Weg der Transkription ausserordentlich gut.

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Benutzerdefiniert
Anbieter	Memberful
Zweck	Our membership system is managed by Memberful.com. Certain cookies from memberful.com will be added to your computer if you become a member of iPhoneBlog #one.
Datenschutzerklärung	https://memberful.com/cookie-policy/
Host(s)	memberful.com
Cookie Name	Membership
Cookie Laufzeit	365

Name	Benutzerdefiniert
Anbieter	VG Wort
Zweck	Das Cookie der VG Wort hilft die Kopierwahrscheinlichkeit unserer Texte zu ermitteln und stellt die Vergütung von gesetzlichen Ansprüchen von Autoren und Verlagen sicher. IP-Adressen werden nur in anonymisierter Form verarbeitet.
Datenschutzerklärung	https://www.vgwort.de/hilfsseiten/datenschutz.html
Host(s)	*vgwort.de
Cookie Name	srp
Cookie Laufzeit	Sitzung

Akzeptieren	Vimeo
Name	Vimeo
Anbieter	Vimeo Inc., 555 West 18th Street, New York, New York 10011, USA
Zweck	Wird verwendet, um Vimeo-Inhalte zu entsperren.
Datenschutzerklärung	https://vimeo.com/privacy
Host(s)	player.vimeo.com
Cookie Name	vuid
Cookie Laufzeit	2 Jahre