GPT-4o vergibt Dateinamen für Fotos und Screenshots (via Shortcuts)

Dateinamen, die Älteren erinnern sich daran noch…

Seit gestern spiele ich mit NameQuick – für die (Open)AI-Umbenennung von Bilddateien. Die macOS-App ist noch sehr buggy, aber die Entwickler reagieren schnell auf Rückfragen.

Ich hatte geplant, dass die App einen iCloud-Ordner im Blick behält und dort alle neu abgelegten PNGs erkennt, über die Prepaid-API zu OpenAI schickt und diesen Dateien dann neue Namen aufdrückt. Genau so funktioniert das auch, allerdings kämpft die Software noch mit allerlei Kinderkrankheiten.

Das Bild zeigt die Dateien-App auf einem iPad mit einem geöffneten Kontextmenü für eine Datei namens "iPhoneBlog.de_watch_leather_band_wrist.jpeg". Im Menü werden verschiedene Optionen wie "Umbenennen", "Komprimieren", "Duplizieren" und "Löschen" angezeigt. Links sind die Speicherorte wie „iCloud Drive“ und „On My iPad“ sowie Favoriten wie „Downloads“ und „Desktop“ sichtbar.

Deshalb kam ich auf die Idee, den „Alt Text generator shortcut“ von Jarrod Blundy in einen „File Name generator shortcut“ umzuschreiben – statt IMG_0286 sollten meine (Bildschirm-)Fotos hier im Blog einen Dateinamen bekommen, den ich im Zweifelsfall darüber auf dem Server wiederfinde.

Um aus GPT-4o eine Handvoll an Wörtern zu schütteln, die ein Foto treffend beschreiben, war es nicht aufwendiger, als lediglich den Prompt im bestehenden Kurzbefehl zu ändern.

Statt „Please create alt text for this image in german language.“ steht dort nun so etwas wie „Suggest a new filename, exactly four words long, divided by underscores and set a fixed prefix iPhoneBlog.de_. Output *only* the four words including the prefix. Do not add any introductory text, explanations, or punctuation other than spaces between the words.“

Mehr hat es nicht gebraucht, um Sekunden später einen passenden Dateinamen in der Zwischenablage zu haben, den ich dann nur noch einsetzen muss.

„Text Workflow“ transformiert Text

Eine Person hält ein Smartphone in der Hand, auf dem eine App mit verschiedenen Aktionen und Funktionen angezeigt wird. Das Gerät scheint ein iPhone zu sein, das in einer braunen Hülle steckt. Die Benutzeroberfläche zeigt Tools wie „Beautify JSON“ und „Convert Case“, die vermutlich zur Text- oder Datenbearbeitung dienen.

Für Text-Transformationen nutze ich seit letztem Jahr die Anwendung Text Workflow (iOS / macOS). Es löscht mir überflüssige Zeilen(-umbrüche) oder Leerzeichen, extrahiert Links und wandelt Textblöcke in Listen.

Es existieren Hunderte von Actions, die euch die Fleißarbeit bei Formatierungen abnehmen (oder einfach jegliche Styles entfernen).

Einzelne Aktionen verbindet man als mehrstufige Arbeitsabläufe, die sich über iCloud synchronisieren. Das Ergebnis einer Umwandlung zeigt eine Vorschau – aber nicht nur in der iOS-/iPadOS-App, sondern auch im Teilen-Menü.

Nicht die eigentliche Anwendung auf euren mobilen Computern öffnen zu müssen, ist ihr bestes Feature. Ich markiere etwa Text auf einer Webseite, wische im Pop-up nach rechts, wähle „Teilen“ und dann die gewünschte Formatierung.

WhatsApp-Sprachnachrichten mit Voicesnotes(.com) transkribieren

WhatsApp transkribiert (seit letztem Herbst) Sprachnachrichten, wenn man die Funktion in den Einstellungen anknipst. Die Chat-App versteht 38 verschiedene Sprachen, kann davon aber gleichzeitig nur eine einzige Sprache aktivieren. Mehrsprachige Nutzer:innen schalten deshalb regelmäßig um.

Das Bild zeigt eine Benachrichtigung in WhatsApp, die erklärt, warum Transkriptionen von Sprachnachrichten nicht immer verfügbar sind. Es werden mögliche Gründe genannt, wie nicht unterstützte Sprachen, falsche Spracheinstellungen oder fehlender Text in der Nachricht. Unten wird darauf hingewiesen, dass die Transkription auf Englisch (USA) eingestellt ist und man die Sprache für die Chat-Transkription ändern kann.

Zuvor kümmerte sich „Just Press Record“ um diese (lokalen) Niederschriften; leider mit der gleichen Einschränkung, aber auch dem Vorteil, diese Texte easy weiterzuverarbeiten.

Seit einigen Tagen leite ich eingesprochene Gedankengänge von Freunden und Bekannten an den WhatsApp-Bot von Voicenotes.com weiter.

Das Bild zeigt zwei Screenshots einer Voicenotes-AI-Integration auf einem iPhone. Links wird eine WhatsApp-Konversation dargestellt, in der eine Sprachnachricht transkribiert und als Notiz gespeichert wurde, während rechts die Benutzeroberfläche der App verschiedene Optionen zur Weiterverarbeitung der Notiz (z. B. Zusammenfassung, E-Mail oder Blogpost) anzeigt. Die App bietet KI-gestützte Funktionen zur Organisation und Bearbeitung von Sprachaufnahmen.

Er übergibt die Audiodatei an den Diktat-Dienst, der um Klassen bessere Ergebnisse liefert – egal in welchen Sprachen. Anschließend klickt man sich dort direkt eine Zusammenfassung oder lässt sich aufgetragene To-dos in Stichpunkten aufschlüsseln.

Von kreativ bis kostspielig und erstmalig ernsthaft: Apple vermarktet TV+ mit Severance

Das Bild zeigt eine Szene aus einer Installation in London, die mit der Apple TV+ Serie Severance verbunden ist. Im Vordergrund steht ein Mann in einem eleganten, gemusterten Cardigan, während im Hintergrund zahlreiche Menschen mit blauen Luftballons zu sehen sind. Die Umgebung ist modern, mit einem Gebäude im Hintergrund und einer riesigen blauen Kugel als Teil der Installation.

Hier einige der einfallsreichen Auszüge:

Das großangelegte Marketing für Severance rückt jedoch ins Rampenlicht, wie ungenügend Apple ansonsten TV+ bewirbt.

Apple lässt dabei Hollywood (direkt) auf sich abfärben, wertet natürlich das eigene Bundle auf und kann TV+ lobend in den Quartalszahlen erwähnen.

Andere Shows hätten den Budget-Topf aber auch verdient. Obwohl ich gar nicht glaube, dass das am Geld scheitert. Apple hatte bis jetzt – fünf Jahre später – die (Be-)Werbung für seinen Streaming-Service nicht ausgetüftelt.

Severance ist zweifelsohne eine herausragende Show, die jede Werbemaßnahme rechtfertigt. Es ist aber nicht der einzige Höhepunkt in ihrem Katalog. Teilweise bekam die begleitende Film- und Serien-Unterhaltung lediglich einen prominenten Banner auf Apple.com oder im App Store, sowie die traditionelle Erwähnung in einer Keynote oder verspätetes Merchandise.

Apple pusht TV+-Probeabos in iOS und versucht sich an „Gratis-Wochenenden“. Bis Februar vermisste der Dienst jedoch eine (wesentlich wichtigere) Android-App – wohlgemerkt Februar 2025. Und der Vertriebskanal über Amazon Prime Video steht erst seit einigen Monaten offen.

So ungewöhnlich das klingt, aber Apples Vermarktung für TV+ scheint erstmalig ernsthaft mit Severance zu starten – wohlgemerkt Severance Season 2.

„In der EU: Apple muss weitere Funktionen mit iOS 19 und iOS 20 öffnen“

Smartwatches, GPS-Uhren, Kopfhörer und Mixed-Reality-Headsets: Solche Hardware müssen iPhones künftig besser unterstützen, auch wenn auf diesen Geräten kein Apple-Logo prangt. Apple muss dafür nach neuen Vorgaben der EU-Kommission spezifische Schnittstellen in iOS 19 und iOS 20 schaffen. Funktionen, die bislang Apples hauseigenen Geräte wie Watches, AirPods und Vision Pros vorbehalten bleiben, stehen dadurch erstmals auch anderen Unternehmen offen. Das diktieren die neuen Interoperabilitätsvorgaben, die die EU-Kommission am Mittwoch spezifisch für Apple erlassen hat.

Heise.de | Leo Becker

Das Bild zeigt die Benutzeroberfläche eines iPhones, auf dem eine Funktion zum Teilen von Informationen mit Personen in der Nähe angezeigt wird. Es gibt einen Hinweis, dass man die Oberseite des iPhones nahe an ein anderes Gerät halten soll, falls keine Personen sichtbar sind. Unten sieht man ein Profilbild und den Namen "Alexander Olma", unter dem der Nutzer erscheint.

It seems like Apple has two options here: comply with the rules or pay fines. But I think there may be a third choice, and I’d be surprised if Apple isn’t considering it. The company could just disable the features altogether. In that scenario, Apple would deprive its own customers of the capabilities rather than giving them up to rival hardware makers. The nuclear option would be a dramatic rejection of the EU’s authority and might help apply pressure to regulators. Consumers may end up being more angry at the EU than at Apple itself.

Bloomberg | Mark Gurman

Sollte Apple die EU-Interoperabilitätsvorgaben im straffen Zeitplan nicht erfüllen (können/wollen), sehe ich das als die nächste, realistische Option.

„Has Search Become Just a Feature?“

I’ve witnessed several transformative moments in internet history: when Mosaic first made the web browsable, when Google made it searchable, and when Facebook made it social. Each wave fundamentally reshaped how we interact with information. This current shift feels similarly momentous, yet distinct in its own way. […]

This shift matters more than you might think. Even the browser, that faithful window into the internet for the past three decades, is starting to feel like a relic. We’re moving from a document-centric web to something more fluid, where information flows naturally through conversation rather than being bound by pages or URLs.

Om Malik

Ich tippe zwischen 400 und 600 klassische Suchanfragen monatlich; Kagi schlüsselt mir diese Statistiken auf. Darunter fallen keine Redirects, die ich am Mac direkt über Monarch absetze und keine AI-Websuchen.

Kagi kombiniert „Suche oder direkte Antwort“, indem man ein Fragezeichen ins Suchfeld tippt und über den Link-Ergebnissen eine Quick Answer bekommt. weiterlesen

#448 – iOS 18.4

Version 18.4 zieht für Apple Intelligence (bei uns) in die Geschichtsbücher ein. Es ist das erste Schlagwort, das jeder mit diesem Release verbindet.

Dabei lässt sich der erste Entwurf dieser cleveren AI-Funktionen weitgehend … ignorieren – selbst wenn sie eingeschaltet sind. Und trotzdem sind die Funktionen tief ins Betriebssystem eingewebt und werden signifikant unsere Nutzung dieses Telefons verändern.

Hier das Intro zur Episode:

Vimeo

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von Vimeo.
Mehr erfahren

Video laden

PHA+PGlmcmFtZSBzcmM9Imh0dHBzOi8vcGxheWVyLnZpbWVvLmNvbS92aWRlby8xMDY5NTQ1NTU1P2JhZGdlPTAmYW1wO2F1dG9wYXVzZT0wJmFtcDtwbGF5ZXJfaWQ9MCZhbXA7YXBwX2lkPTU4NDc5IiB3aWR0aD0iNjQwIiBoZWlnaHQ9IjMyMCIgZnJhbWVib3JkZXI9IjAiIGFsbG93PSJhdXRvcGxheTsgZnVsbHNjcmVlbjsgcGljdHVyZS1pbi1waWN0dXJlOyBjbGlwYm9hcmQtd3JpdGU7IGVuY3J5cHRlZC1tZWRpYSI+PC9pZnJhbWU+PC9wPg==

iPhoneBlog #one kann man abonnieren. Alle Abonnent:innen bekommen jede Woche ein neues „Gewusst-wie”-Video, den Zugriff auf alle schon veröffentlichten Episoden und die Einladung zu einer ganz besonderen Community in einem privaten Slack-Kanal.

iPhoneBlog #one ist ausschließlich von Lesern und Leserinnen finanziert und unterstützt direkt das iPhoneBlog.

„Joi Planner“ #limited-time #free

Das Bild zeigt zwei iPhones mit der Benutzeroberfläche einer Produktivitäts-App. Auf dem rechten Bildschirm wird eine Tagesübersicht angezeigt, einschließlich eines Termins, Aufgaben und Gewohnheiten, sowie Gesundheitsdaten wie Schritte und Schlafdauer. Der linke Bildschirm bestätigt die Aktivierung eines Pro-Abonnements mit Funktionen wie Apple Health-Synchronisierung, benutzerdefinierten Icons und Benachrichtigungen.

Joi verheiratet Aufgaben, Kalender und Gewohnheiten in einem Design, dem ich verdammt noch einmal kaum widerstehen kann.

via iPhoneBlog.de

„Lifetime“ für Joi Planner beträgt aktuell 0,00 EUR.