Auf die richtigen Worte kommt es an: So funktioniert Voice Commerce

Voice Commerce ist das Einkaufen und Bezahlen mittels Spracheingabe. Die Technologie verspricht mehr Bequemlichkeit beim Online-Shopping, steckt aber noch in den Kinderschuhen.

Voice Commerce_460x323.png
Smart Speaker. Foto Adobe Stock

Voice Commerce ist der Überbegriff für verschiedene Varianten des digitalen Shoppings, deren Gemeinsamkeit darin liegt, dass Such- oder Kaufanfragen über das gesprochene Wort, also akustisch erfolgen. Die Anwendung von herkömmlicher Sprachsteuerung erfolgt hier im Rahmen des Online-Shoppings. Anstelle von Klicks oder Wischbewegungen wird einfach gesagt, was das Gerät tun soll beziehungsweise was gekauft werden möchte.

Je nach Definition versteht man unter Voice Commerce lediglich das Durchstöbern von Online-Shops nach Produkten, nur den Bestellvorgang an sich, den reinen Bezahlvorgang – oder alles gemeinsam. Im Folgenden ist mit dem Begriff „Voice Commerce“ stets die weite Bedeutung gemeint, die alle genannten Komponenten umfasst.

Hinweis

Der sehr ähnliche Begriff „Conversational Commerce“ ist noch eine Spur weiter gefasst. Er beinhaltet jede Art der sprachgebundenen Kommunikation, insbesondere auch schriftliche oder via Chatbots.

Technische Voraussetzungen für Voice Commerce

Grundsätzlich gibt es zwei Möglichkeiten, an der Welt des Voice Commerce teilzunehmen: über stationäre und mobile Endgeräte.

Zu ersteren zählen vor allem die so genannten Smart Speaker. Das sind Lautsprecher, die mit dem Internet verbunden sind und zusätzlich über ein eingebautes Mikrofon verfügen. Mittels Sprachbefehlen kann man zum Beispiel News abfragen, sich Musik-Streams vorspielen oder den aktuellen Wetterbericht vorlesen lassen. Die meisten Geräte erlauben auch die Integration in Smart Home Systeme. Bekannte Smart Speaker sind Alexa (Amazon), Cortana (Microsoft), Google Assistant (Google) und Siri (Apple).  Alle diese Geräte sind ausgereift und funktionieren sehr zuverlässig. Allerdings ist ihre Anwendung auf die eigenen vier Wände beschränkt. Heute sind Sprachassistenten wie „Okay Google“ oder „Hey Siri“ aber auf so gut wie jedem Smartphone bereits vorinstalliert und müssen nur noch in den Einstellungen aktiviert werden. Auch „Alexa“ ist für alle Smartphone-Betriebssysteme kostenlos erhältlich. Für die Nutzung müssen Userinnen und User jedoch ein Amazon-Benutzerkonto besitzen.

Hinweis

In unserem Artikel „Was bedeutet Smart Home?“ lesen Sie nähere Infos dazu, was man unter einem "intelligenten" Haushalt versteht und welche Bedrohungen Smart Homes für Userinnen und User bergen können.

Einkaufen und Bezahlen per Sprachbefehl

In Österreich kann gegenwärtig nur mit „Alexa“ über einen Sprachbefehl direkt eingekauft und der Bezahlvorgang abgeschlossen werden. Außerdem sind Bestellungen nur für bestimmte Amazon-Produkte möglich (Prime). „Siri“ bietet diese Funktion nicht an und Einkaufen via „Google Assistant“ ist derzeit nur in bestimmten Ländern möglich. Alle genannten Anwendungen ermöglichen es jedoch, per Sprachbefehl gesuchte Produkte einer digitalen Einkaufsliste hinzuzufügen und diese nach Belieben vom Sprachassistenten laut vorlesen und ändern zu lassen.

Die Abbuchung erfolgt über das Amazon-Kundenkonto der Userin beziehungsweise des Users. Bezahlmethode und Lieferadresse müssen im Benutzerkonto standardmäßig zu diesem Zweck hinterlegt sein. Eine Bestellbestätigung erfolgt per Audio und E-Mail.

Vorteile von Voice Commerce

Shoppen via Sprachsteuerung bietet einige Chancen:

  • Der offenkundigste Vorteil von Voice Commerce ist, dass Sprache ein natürliches Kommunikationsmedium ist – es brauchen also keine komplizierten Befehlsabfolgen oder Programme erlernt werden.
  • Ein weiterer Vorteil ist die Schnelligkeit. Das Wort „Bezahlen“ auszusprechen, geht oft schneller als Bezahlvorgänge online auszuführen.
  • Bequemlichkeit: Wer spricht, hat gleichzeitig die Hände frei. Das schafft Bewegungsspielraum.
  • Grundsätzlich ist die Sprache eines Menschen ein biometrisches Merkmal und bietet eine hohe Sicherheit, etwa bei der Zugangskontrolle oder zur Überprüfung von Berechtigungen.
  • Insbesondere eignet sich die Technologie für Anwenderinnen und Anwender mit körperlichen Beeinträchtigungen.
  • Durch die Möglichkeit, Voice Commerce am Smartphone zu nutzen, könnte sich digitales Einkaufen und Bezahlen per Sprachbefehl als Alternative oder Ergänzung zu herkömmlichen Technologien des mobilen Bezahlens etablieren.

Grenzen des Voice Commerce

Moderne Verfahren zur Spracherkennung analysieren gesprochene Sätze phonetisch, grammatikalisch und semantisch. Dabei setzen sie statistische Modelle und Algorithmen aus der künstlichen Intelligenz (KI) ein. Die besten Systeme erreichen damit eine Erkennungsrate von mehr als 96 Prozent. Dennoch können verschiedene Faktoren die Spracherkennung negativ beeinflussen oder sogar ganz falsche Ergebnisse zeigen:

  • Undeutliche Aussprache
  • Dialekte
  • Sprachstörungen
  • Hintergrundgeräusche

Hinzu kommt, dass auch aktuelle Sprachassistenten viele Aspekte der menschlichen Sprache nicht verstehen oder erkennen. Sprechtempo und -melodie, komplexe Formulierungen, Füllwörter oder Redewendungen, semantische Mehrdeutigkeiten und anderes, das für Menschen problemlos verständlich ist, führt in der maschinellen Sprachverarbeitung häufig zu Fehlern.

Voice Commerce mit Sprachassistenten funktioniert dann am besten, wenn man sich auf grammatikalisch sehr simple Sätze beschränkt, etwa „Alexa, wo Schuhe kaufen?“.

Konsumentinnen und Konsumenten müssen beim Voice Commerce auf Produktvergleiche, bildliche Darstellungen der Waren und viele andere Informationen verzichten, die für eine Kaufentscheidung nicht unwesentlich sind. Ein rein akustisches Interface ist zudem für die meisten nicht vertraut. Userinnen und User sind es mittlerweile gewohnt, Informationen zumindest auf dem Display des Smartphones angezeigt zu bekommen. Dieses Phänomen, das auch als „visuelle Kluft“ (visual gap) bezeichnet wird, sorgt bei Konsumentinnen und Konsumenten für Unsicherheit. Viele befürchten, versehentlich etwas Falsches zu kaufen.

Ein weiteres Problem im Kontext des Voice Commerce sind die Empfehlungsalgorithmen beziehungsweise die Frage, nach welchen Kriterien der Sprachassistent eine Ergebnisliste erstellt und das gesuchte Produkt anzeigt. Sprachassistenten wie Alexa begünstigen bei einer Suchanfrage die Produkte des eigenen Unternehmens und tragen so zu einer Wettbewerbsverzerrung bei. Andere Online-Händler sowie stationäre Geschäfte, die das gewünschte Produkt lagernd haben könnten, haben in solchen Fällen das Nachsehen. Diese Bedenken führen dazu, dass bisher nur sehr wenige Menschen mittels Sprachbefehlen einkaufen und bezahlen. Auch in Österreich ist Voice Commerce bisher eine Randerscheinung. Während mehr als 900.000 Konsumentinnen und Konsumenten Sprachassistenten nutzen, verwenden nur 38.000 Menschen diese Technologien zum Einkaufen. Diese Zahlen sind ein Ergebnis der „eCommerce Studie Österreich – Konsumentenverhalten im Distanzhandel“ von 2021, die jährlich von KMU Forschung Austria im Auftrag des Handelsverbandes durchgeführt wird.

Sicherheit beim Voice Commerce

Grundsätzlich bietet die gesprochene Sprache als biometrisches Merkmal hohe Sicherheit, etwa bei Zugangskontrollen, Authentifizierungen oder zur Überprüfung von Berechtigungen. Die eigene Stimme kann dann, wie etwa bei der Voice-Match-Funktion von Google, zur Sicherung des Geräts dienen und das Smartphone per Sprachbefehl entsperren. Die Stimmerkennung ist jedoch fehleranfällig und daher als biometrisches Sicherheitsverfahren oft nicht die erste Wahl.

Bei „Alexa“ können zum Beispiel persönliche Stimmprofile hinterlegt werden, die auch zur Verifizierung bei Einkäufen dienen können. Alternativ kann zur Absicherung vor unbefugten Einkäufen eine akustische Eingabe (Sprachcode) eingestellt werden. Der Sprachcode sollte auf keinen Fall geteilt werden. Auch stellt der Sprachcode ein Sicherheitsrisiko dar, wenn er in der Öffentlichkeit laut ausgesprochen wird und andere Personen mithören können.

Hinweis

Letzte Aktualisierung: 14. Februar 2022

Für den Inhalt verantwortlich: A-SIT Zentrum für sichere Informationstechnologie – Austria