Das klassische Einkaufen lebt von Musik & Sprache, die Emotionen und der Austausch fördern das Shopping-Erlebnis. Der „stumme“ Online-Shop, der durch Tippen und Klicken bedient wird, kann durch die Einbindung von Audio- und Voice-Funktionen angereichert werden. Die Möglichkeiten der künstlichen Intelligenz lassen das digitale Einkaufserlebnis entlang der Customer Journey – von der sprachunterstützten Suche über die stimmliche Beratung zum interessanten Produkt – neue Dimensionen erreichen.
Der nächste Urlaub steht bevor, die Koffer sind gepackt und im Auto verstaut. Mit Vorfreude starten wir, um in einem attraktiven Hotel eine neue Region bei sonnigem Wetter zu erleben. Wir verzichten auf eine Flugreise, wir nutzen das Auto für Flexibilität bei der Anreise und für Ausflüge vor Ort. Aus den Vorbereitungen hat man eine Ahnung von der Route, aber zur Sicherheit wird das Navigationsgerät aktiviert. Ein modernes Auto hat natürlich ein Navi mit Sprachfunktion, in den meisten Fällen versteht das Gerät unsere Eingabe mit Stimme einwandfrei, nach einem kurzen Bestätigen geht es los.
Man erlebt auch immer häufiger bei Suchanfragen, dass die Stimme gegenüber dem Eintippen von Buchstaben mit dem Daumen genutzt wird. Eigentlich ist das übliche Verwenden des breitesten Fingers bei kleinen Tasten statt dem sogenannten schmalen Zeigefinger eine Smartphone-Skurrilität. Bei Suchmaschinen geht das zum Beispiel mit dem Google Assistant oder der Google App. Auch bei ChatGPT kann die Sprachsteuerung einfach aktiviert werden, man erspart sich das Tippen und nutzt die flüssige Sprache.
Beim digitalen Einkaufen gewinnen Voice-Funktionen an Bedeutung, auch geprägt von den positiven Erfahrungen rund um Sprache & Ton beim klassischen Einkaufen. Stellen Sie sich ein Geschäft ohne Ton vor: kein Mensch spricht, keine Musik läuft, kein Verkäufer antwortet auf Fragen. Die digitalen Online-Shops können durch die bewusste Integration vom Sinn Hören aufgewertet werden, die Bandbreite reicht von der Produktsuche mit Spracheingabe über barrierefreies Lesen zum Anhören bis zur Audio-Produktberatung über den Chatbot.
Das Verbinden von Audio & Voice mit künstlicher Intelligenz
Das Wort „Audio“ hat die Wortwurzel in der lateinischen Sprache, das „audire“ steht für Hören. Mit dem Hören sind Töne verbunden, welche vom Menschen aufgenommen werden oder als „Voice“ mit Stimme an ein Gegenüber – wie eine Suchmaschine oder ein Online-Shop – weitergegeben wird. Man erspart sich ein Tippen oder Klicken, die Kommunikation entspricht der gewohnten Mensch-zu-Mensch Kommunikation.
Das Wesen einer erfolgreichen Einbindung von Audio & Voice in der digitalen Vermarktung ist ein verlässliches Funktionieren. Wenn man zu einem Artikel im Online-Shop eine Beschreibung vorgelesen haben möchte, dann soll der Text über die Audio-Funktion mit einer angenehmen Stimme und im Inhalt mit Korrektheit wiedergegeben werden. Beim Einsatz der Voice-Funktion ist ein User Interface der Sprachassistent, das kann das eigene Smartphone oder ein HomePod wie Alexa oder Siri sein. Durch die dynamische Entwicklung der Systeme und Tools mit künstlicher Intelligenz wird bereits eine beeindruckende Qualität erzielt.
Der Verfasser des Artikels war selbst beeindruckt von den Fähigkeiten des KI-Tools Suno beim Generieren eines persönlichen Songs für ein Geschenk zu einem runden Anlass. Tipp: probieren Sie das Audio-Tool aus, die Kombination mit dem Verfassen der Text-Strophen über eine KI wie ChatGPT und dem Einspielen der Musik in einem Genre freier Wahl über Suno lässt manche Agentur erblassen, der selbst entwickelte einzigartige Family-Song oder der differenzierende Company-Sound können positiv überraschen.
Unterschiedliche Studien prognostizieren eine Entwicklung in Richtung Voice
Eine internationale Studie von PwC in 27 Ländern prognostiziert starkes Wachstum für Voice Commerce. Die Ergebnisse zeigen, dass bereits 11 % der deutschen und 8 % der europäischen Verbraucher mindestens wöchentlich Sprachassistenten wie Amazon Echo oder Google Home nutzen, um die Einkäufe zu tätigen. In Österreich kann – als traditionelles Land – derzeit noch von einer geringeren Penetration beim Shopping ausgegangen werden, aber auch die eCommerce Studie Österreich des Handelsverbands weist 12 % der Österreicher:innen als Inhaber von Assistenten über Sprache aus.
Eine andere Studie – von Deloitte in Zusammenarbeit mit Google und dem Handelsverband Deutschland – machte eine Einschätzung zu Voice Commerce im Jahr 2030. Die Ergebnisse sind erstaunlich: die Berechnungen ergeben, dass rund 30 % der E-Commerce-Umsätze in Europa auf Voice Commerce entfallen könnten. Als Treiber wird die Bedienungsfreundlichkeit über die Sprache gesehen, bis dahin könnten Sprachassistenten ergänzend zu Smartphones & Hardware in Uhren oder Stiften integriert werden.
Praktische Ansätze für Audio & Voice im E-Commerce
Die Zukunft wird zeigen, ob die Einschätzungen stimmen. Aber wer hätte vor dem Herbst 2022 gedacht, dass die künstliche Intelligenz mit ChatGPT & Co in kurzer Zeit so prägend wird? Nach-folgend einige Einsatzfelder zum praktischen Anwenden in der Gegenwart:
- Audio zum Erklären: Zu technischen Geräten gehört, dass sich Interessierte für mehr Verständnis intensiver beschäftigen müssen. Die Kaufentscheidung wird von hilfreichen Informationen beeinflusst, auch beim Installieren helfen nützliche Tipps. Mit Unterstützung von KI-Tools wie Wondercraft, mit dem der Verfasser sehr gute Erfahrungen beim Aufbau von Podcast-Erklärungen zu Fachthemen gemacht hat, können z.B. im Dialog gesprochene Texte einfach produziert werden.
- Audio zum Beschreiben: Lange Produktbeschreibungen liest man sich nicht gerne durch. Auch diese lassen sich über KI-Tools in Sprache zum Anhören verwandeln, zu den bewährten Audio-Tools zählen ergänzend zu Wondercraft ElevenLabs und NotebookLM.
- Voice als Beratung: Das breitflächige Bestellen über den Sprachassistenten ist ein Blick in die Zukunft. Aber durch personalisierte Werbung über Google Home & Co kann bei technisch versierten Käufern – dazu können Personen aus der Elektrobranche gezählt werden – eine Beeinflussung vor der Kaufentscheidung stattfinden.
- Audio für Spots: Werbung mit Musik & Sprache (wie Radiospots oder Durchsagen im Geschäft) lässt sich über das KI-Tool AudioStack einfach produzieren. Dieses Tool ist eine bewährte Plattform, alternativ zum weiter oben angeführten Suno. Es lässt sich auch ein eigener Branding-Sound für das eigene Unternehmen generieren.
Zusammenfassend: Musik und Sprache können emotionalisieren, stärker als lange Texte zum Lesen am kleinen Bildschirm vom Smartphone. Unterschiedliche internationale Studien prognostizieren eine steigende Bedeutung für Voice Commerce, d.h. Bestellen über die Sprache. Bereits Realität sind die Möglichkeiten von KI-Tools zu Audio-Anwendungen, welche kundenfreundlich und differenzierend zum Wettbewerb zum Zuhören rund um das Einkaufen einladen.

Harald Rametsteiner
UPGROW Marketing Consulting
Lehrgangsleiter MBA General Management der FH des BFI Wien & E-Learning Group