Gastbeitrag
Wie Sprach- und Bildsuche das Finden revolutionieren
Mehr als eine Stunde benötigen sie, um online das passende Geschenk zu suchen. Darin waren sich die Teilnehmer der Online Marketing Konferenz OMX 2017 in Salzburg spontan einig. Die Identifizierung des treffenden Suchwortes, die korrekte Schreibweise und viele Aspekte mehr machen die Textsuche zu einem zeitaufwendigen Prozess. Dass das textbasierte Finden im Web ineffizient ist, bestätigen auch 74% der US-Kunden in einer Umfrage des amerikanischen Unternehmens Slyce.
Was wäre, wenn wir aufhören zu suchen und anfangen zu finden? Schnell, bequem und intuitiv?
Massive Investitionen von Google, Amazon und Co. in künstliche Intelligenz (KI) und maschinelles Lernen ermöglichen ein schnelles Finden. Diese Technologien sind bereits Teil unseres Alltags, ohne dass uns das bewusst ist. Etwa die Autovervollständigung beim Tippen von Wörtern in unser Handy, oder das Taggen von Gesichtern in Fotos, die wir auf Facebook hochladen. Beides sind Funktionen, die auf KI und maschinellem Lernen basieren.
Diese Begriffe geistern schon eine Weile durch die Medien. Tatsächlich existiert die Technologie bereits seit den 1950er Jahren und beschäftigt die Wissenschaft mindestens ebenso lange. Stark vereinfacht bedeutet KI, dass Maschinen vom Menschen lernen, Dinge wie etwa das Schachspielen zu tun. Maschinelles Lernen leitet sich aus dieser Zielsetzung ab und geht einen Schritt weiter: Maschinen lernen, sich selbst ganz ohne menschliches Zutun weiterzuentwickeln, z.B. indem sie Fehler beim Schachspiel erkennen und diese bei künftigen Partien zu vermeiden versuchen. Mit Erfolg: 1996 schlug erstmalig eine Maschine – der IBM Computer Deep Blue – den damaligen Schachweltmeister Garri Kasparow.
Wie helfen uns diese Technologien beim schnellen Finden?
Erkennung, Verstehen und Synthese von Sprache sind Unterformen des maschinellen Lernens. Suchmaschinen-Giganten wie Google und Baidu machen auf diesem Gebiet riesige Fortschritte. So konnte Google die Fehlerrate seiner Spracherkennungssoftware in weniger als einem Jahr nahezu halbieren – von 8,5 Prozent im Juli 2016 auf 4,9 Prozent im Mai 2017. Damit liegt sie auf menschlichem Niveau.
Weitere Verbesserungen in der Spracherkennung sind zu erwarten. Mit dem Ergebnis, dass bis 2021 mehr Geräte mit digitalen Assistenten ausgestattet sein werden als es Menschen auf der Welt gibt. Sprachsuche wird demnach allgegenwärtig – über digitalen Sprachassistenten wie Google Assistant, Siri (Apple), Alexa (Amazon), Cortana (Microsoft), Bixby (Samsung) und über sprachgesteuerte Chatbots wie dem Zalando Geschenkefinder. Doch was sind die Vorteile der Sprachsuche und wie werden diese Suchanfragen und -ergebnisse sowie die Customer Journey verändern?
Sprachsuche ist barrierefrei
Die Vorteile von sprachgesteuerter Suche gegenüber der herkömmlichen Textsuche liegen auf der Hand: Sie ist wesentlich schneller, bequemer, müheloser, intuitiver und ermöglicht Multitasking. Darüber hinaus ist sie barrierefreier: Zum ersten Mal können Menschen, die nicht lesen und schreiben können, die blind, sehbehindert oder körperlich eingeschränkt sind, autonom an dieser neuen Art des Findens teilhaben.
Wie verändert Sprachsteuerung unsere Suchanfragen und Suchergebnisse?
Wenn Nutzer mit digitalen Assistenten sprechen, ändern sich ihre Suchanfragen. Sie werden länger, denn sie reden nun wie mit einer Person: in ganzen Sätzen anstatt einzelne Keywords zu verwenden. Sie stellen mehr Ja/Nein- und W-Fragen und Suchanfragen haben häufiger einen lokalen Bezug. Bei sensiblen oder unangenehmen Themen greifen Nutzer aber wieder auf Textsuche zurück. Denn sie möchten ja nicht, dass der gesamte Zug mithört.
Auch die Suchergebnisse verändern sich: In einer sprachgesteuerten Welt gibt es keine klassische Ergebnisseite mit zehn organischen Treffern mehr. In den meisten Fällen liest der digitale Sprachassistent nur ein Ergebnis vor. Google Home greift hier beispielsweise auf den Antworttext seines sogenannten Featured Snippets (Antwortbox) zurück.
Die Customer Journey wird reibungsloser
In den USA zeigen u.a. Google und der Einzelhandelsriese Walmart wie Sprachsteuerung die Kundenreise schneller und reibungsloser machen kann als die herkömmliche Bestellung im Online-Shop. Seit Ende September 2017 können Walmart-Kunden über Google Home sämtliche Produkte – vom Waschmittel bis hin zur Tafel Schokolade – per Sprachbefehl bestellen. Auch der US-Discounter Target bietet in Kooperation mit Google seit Mitte Oktober 2017 einen ähnlichen Service für seine Kunden an.
Neben der Sprachsuche gibt es einen weiteren Trend: die visuelle Suche.
Visuelle Suche: sprachlos finden
Fehlen dem Nutzer die Worte, greift die visuelle Suche. 90 Prozent der Informationen die unser Gehirn aufnimmt, sind visuell und werden 60.000 Mal schneller verarbeitet als Text. Das bedeutet, das bildbasierte Finden ist noch intuitiver, bequemer und schneller als die Sprachsuche. Das Nachdenken über die Aussprache eines Wortes (etwa in einer anderen Sprache) entfällt. Stattdessen wird einfach via Bilddatei gezeigt, was gefunden werden soll.
Visuelle Suchfunktionen geben dem Kunden die Macht
Pinterest veröffentlichte im März 2017 seine visuelle Such-Funktion „Lens“ und revolutionierte damit das Finden. Basierend auf maschinellem Sehen erkennt Lens ein Objekt – etwa ein Kleid – und zeigt passende Informationen dazu an. In den USA und Europa wird diese Technologie bereits kommerziell genutzt und ist in Apps von Asos, über Lidl bis hin zu Zalando integriert. Kunden nehmen so das Finden in ihre Hand und zeigen ihrem favorisierten Online-Shop, was sie sehen wollen. Kategorien und Filter auf Webseiten wirken vergleichsweise starr und unflexibel, lassen sie doch Suchkriterien wie Muster, Form, Länge und Stil oft außer Acht.
Lens heißt auch eine ähnliche Funktion auf Googles neuestem Mobiltelefon Pixel 2. Auf dem Vorgängermodell Pixel 1 umfasste dies noch einzig den Namen und die Eckdaten einer fotografierten Sehenswürdigkeit. Mit der neuen Version erkennt Lens nun Objekte in Echtzeit und ergänzt beispielsweise die passenden Kundenbewertungen aus dem Web, etwa beim Erkennen eines Restaurants, Hotels oder Museums. Traditionelle Offline-Geschäfte sollten sich also spätestens jetzt aktiv um ihre Online-Reputation kümmern.
Jeder kann seinen Kunden das Finden erleichtern
Neben den Riesen Pinterest, Google und Amazon gibt es inzwischen zahlreiche kleinere Unternehmen, die sich auf visuelle Suchwerkzeuge spezialisiert haben. Etwa das Berliner Unternehmen EyeEm oder das Schweizer Start-Up Fashwell. Einige bieten ihre Technologien zur Integration in bestehende Apps oder Webseiten an.
Experten sagen, dass sich sprachgesteuerte und visuelle Suche gemeinsam durchsetzen werden, wie Shawn Coombs, Senior Director Product Management bei Home Depot. Andere sagen, dass bis 2020 50 Prozent aller Suchanfragen visuell oder sprachgesteuert sein werden, wie Andrew Yan-Tak Ng, ehemaliger Chief Scientist bei Baidu. Fest steht, dass diese beiden Trends bereits jetzt das Finden revolutionieren.
Über die Autorinnen
Kathleen Jaedtke und Tina Nord recherchieren und erforschen die Auswirkungen neuer Technologien wie maschinelles Lernen auf Content und Suchmaschinenoptimierung. Die Autorinnen und Sprecherinnen arbeiten beide als Teamleiter im Content Marketing bei Zalando. Sie bringen Wissen und Erfahrung aus insgesamt 14 Jahren in diesem Bereich mit. Tina auf Twitter: @NordT2. Kathleen auf Twitter: @KathleenJaedtke
Kennt Ihr schon unseren #StartupTicker? Der #StartupTicker berichtet tagtäglich blitzschnell über die deutsche Start-up-Szene. Schneller geht nicht!
Startup-Jobs: Auf der Suche nach einer neuen Herausforderung? In der unserer Jobbörse findet Ihr Stellenanzeigen von Startups und Unternehmen.