Bilderkennung – Potentiale im E-Commerce ausschöpfen - News auf topsoft

Bilderkennung – Potentiale im E-Commerce ausschöpfen

Bilderkennung beschreibt die Identifizierung von Objekten, Bauwerken, Personen oder Mustern in Bildern durch eine sich ständig weiterentwickelnde Technologie. In der Industrie wird diese Technik bereits eingesetzt, aber auch für Onlineshops und Apps werden Data-Science-Methoden immer relevanter. Künstliche Intelligenz und Machine Learning eröffnen neue Möglichkeiten für Anbieter und Nutzer, die es gezielt zu nutzen gilt.

Bild: Pixabay von Gerd Altmann 

In der heutigen Zeit spielen Bilder und Videos eine deutlich größere Rolle, als noch vor einigen Jahren. Das Internet, insbesondere Online Shops und Social Media, werden mit grafischen Elementen geflutet. Unsere Aufmerksamkeit springt von einem Eye-Catcher zum nächsten und überfliegt zwischengelagerte Texte. Dabei erkennen wir den Inhalt eines Bildes im Bruchteil einer Sekunde und verstehen dadurch Zusammenhänge. Um diesen Vorteil auch im E-Commerce, der Produktentwicklung oder im Marketing nutzbar zu machen, wird die Technik der Bilderkennung kontinuierlich verbessert. Dabei reichen die Einsatzgebiete der Technologie weit über die Erkennung biometrischer Merkmale, die für viele Smartphone User alltäglich sind, hinaus.

Bisherige Einsatzgebiete der Bilderkennung

Grundsätzlich dient die Bilderkennung nicht nur der Verarbeitung des Bildes, sondern auch der Umwandlung in die entsprechende Information, also dem Verstehen. Speziell in der Fertigungsindustrie werden erfolgreich Bilderkennungssysteme angewandt, um Fehler bei Zwischenprodukten zu erkennen oder Unstimmigkeiten aufzudecken. Mittlerweile wird diese Technik auch zielführend in der Medizin eingesetzt. Sie unterstützen vor allem bei Krankheitsdiagnosen, für die eine Röntgenaufnahme oder ein CT notwendig sind. Hierbei werden dem Algorithmus die relevanten Bilder zum Lernen gegeben und darauf spezialisiert Anomalien zu erkennen. Der große Unterschied zu Ärzten ist hierbei, dass eine Software die riesige Mengen an Material deutlich schneller verarbeiten kann. In der gleichen Zeit wäre es einem Spezialisten nur mit viel Erfahrung möglich, die gleiche Anzahl an Daten zu sichten. Das liegt vor allem daran, dass Datensets, die für das Anlernen von Bilderkennungssystem notwendig sind, oft Millionen von Bildern umfassen.

Mögliche Anwendungsbereiche im E-Commerce

Anhand einer Studie von Facebook wird deutlich, welches Ausmaß Bilderkennungssoftware annehmen kann: Die Social Media Plattform ließ, mit Hilfe des bisher für blinde Menschen genutzten Algorithmus, auf über 16.000 Konten prüfen, ob diese Bilder mit Hunden oder Katzen hochgeladen hatten. Anhand der Ergebnisse konnten Rückschlüsse auf den Wohnort, Lieblingsserien, die Anzahl an Freunden und besuchten Orten gezogen werden. Facebook gibt an, die Nutzererfahrung mittels dieser Studie verbessern zu wollen, zusätzlich legt dies aber auch die Schlussfolgerung nahe, dass Anzeigen und Werbung noch exakter ausgesteuert werden könnten. Ähnlich hierzu bedienen sich bereits einige Onlineshop-Betreiber der Fähigkeiten der Bilderkennung, um anhand von Kundenbildern bspw. deren favorisierten Marken zu erforschen. Anschließend werden diese Informationen für zielgerichtete Marketingmaßnahmen und die Empfehlungen von expliziten Kleidungsstücken verwendet. Mit solchen Funktionen erleichtert Bilderkennung Onlineverkäufern das Leben, aber wie funktioniert die zugrundeliegende Technologie?

Machine Learning und künstliche Intelligenz

Das erklärte Ziel der Bilderkennung ist es, Prozesse, die eine Auswertung zahlreicher Bilder erfordern, zu vereinfachen und zu automatisieren. Damit dieser Prozess jedoch reibungslos abläuft, ist ein Algorithmus notwendig, der – ähnlich wie ein Mensch – selbstständig lernt und den Lernprozess regelmäßig optimiert. Normalerweise werden Maschinen so programmiert, dass sie mithilfe eines konkreten Inputs und einer Technologie bzw. Software autonom einen Output produzieren. Das einfachste Beispiel hierfür ist ein Taschenrechner. Nutzer geben Zahlenkombinationen ein und die hinterlegte Formel errechnet die Lösung. Bei der Bilderkennung wird dieser Prozess verändert: Maschinen wird mithilfe des vorher definierten Inputs und Outputs beigebracht, den richtigen Algorithmus selbst zu finden. Auf Basis der eingespeisten Daten ist die Software in der Lage Muster und Gesetzmäßigkeiten zu erkennen, weshalb die händische Anpassung des Algorithmus durch einen Entwickler nicht dauerhaft notwendig ist. Diese Art der Erkennung wird als Machine Learning bezeichnet, wobei das Wahrnehmen von Objekten, wie Gesichter oder Autos, die zentrale Rolle spielt. Je größer der eingespeiste Datensatz ist, umso bessere Lösungen werden entwickelt, da der Algorithmus mehr Informationen als Bewertungsbasis hat. Man kann daher von künstlichem Wissen aus Erfahrung sprechen. Bei der Bilderkennung ist es auch möglich, über das reine Erkennen von Objekten oder Menschen hinaus zu gehen. Ziel ist es dann, das grafische Element zu verstehen, ohne dass spezifische Eigenschaften vorher vorgegeben wurden. Dieses Lernen wird als Deep Learning bezeichnet und ist ein Teilbereich der künstlichen Intelligenz. Die Regeln für die Analyse des Bildes werden hierbei zwar vorgegeben, das aktive Lernen wird aber von der Software übernommen. In den folgenden praktischen Beispielen wird deutlich, wie nützlich Bilderkennung sein kann.

Bilderkennung in der Praxis

Bilderkennung kann sowohl für Onlineshop Besitzer als auch deren Kunden einen enormen Mehrwert bieten. Nicht nur die Bedienerfreundlichkeit kann stark erhöht werden, auch Umsatzpotenziale rücken in erreichbare Nähe und zeitaufwendige Interaktionen mit den Kunden können – bei gleichbleibender Leistung für diesen – minimiert werden.

Bilderkennung für Dichtungen

Wer schon einmal auf der Suche nach der richtigen Dichtung für die eigene Dusche oder das Fenster war, der wird festgestellt haben, dass die Auswahl der passenden Dichtung durchaus eine Herausforderung darstellt. Länge und Breite des Produkts lassen sich zwar messen, aber die Rundungen und Kanten sind schon schwieriger in eine Suchanfrage zu verpacken. Auf der anderen Seite haben Onlineshops für Dichtungen das Problem, dass Kunden nicht genau wissen, welchen Artikel sie bestellen sollen. Diese rufen vor dem Kauf an oder senden Produkte häufiger zurück. Die Programmierung einer effektiven Bilderkennungssoftware hat hier zur Lösung des Problems beigetragen: Im Onlineshop des Dichtungsherstellers besteht die Möglichkeit, ein Bild der gewünschten Dichtung hochzuladen. Anschließend werden die passenden Produkte angezeigt. Natürlich stellt die Bilderkennung im Produktbereich auch einige Herausforderung dar. Das Foto wird von jedem Kunden in unterschiedlichen Lichtverhältnissen oder Winkeln aufgenommen. An dieser Stelle optimiert ein zusätzlicher Algorithmus die Bilddaten, indem er Schatten und Hintergründe bereinigt. Durch diese Art der Vorverarbeitung wird die Erkennungsrate deutlich verbessert.

Bilderkennungen für Google, Ebay & Co.

Normalerweise geht man davon aus, dass sich in den Weiten des Internets nahezu alles finden lässt. Aber wie gestaltet sich das, wenn man auf der Suche nach einem ganz konkreten Produkt ist? Google bietet die Möglichkeit an, ein Bild in die Suche zu ziehen, um sich ähnliche Bilder ausgeben zu lassen. Wer also auf der Suche nach weißen Turnschuhen ist, wird garantiert weitere helle Schuhe angezeigt bekommen. Problematisch wird es, wenn Sie auf Plattformen wie Ebay nach sehr spezifischen oder gar einzigartigen Objekten suchen möchten. Wie beispielsweise ein Vertreiber von Comic Spielfiguren, der das Ziel hatte, ganz bestimmte Sonderausgaben und Originale für seine Kunden von anderen Sammlern zu erwerben. In der unglaublichen Menge von Angeboten auf Ebay kann dieser zwar Filter einstellen, aber die einzigartigen Eigenschaften der Figuren sind meist nicht hinterlegt. Der verwendete Algorithmus ist darauf spezialisiert präzise Erscheinungsbilder der Spielfiguren zu erkennen und diese Artikel dem Kunden vorzuschlagen, sobald sie von einem Verkäufer auf Ebay eingestellt wurden. Somit konnte Bilderkennung dem Nutzer unglaublich viel Zeit bei der Recherche nach passenden Produkten einsparen. Aufgrund der ständigen Weiterentwicklung der Bilderkennungstechnologie werden in Zukunft auch andere Onlineshop-Betreiber von den Funktionen profitieren, um ihre Verkaufsprozesse zu verbessern.

Implikationen für E-Commerce

Die beschriebenen Anwendungsgebiete und Möglichkeiten, welche mittels Bilderkennung umgesetzt werden können, zeigen deutlich, dass Potentiale vor allem im E-Commerce und den damit verbundenen Marketingvarianten genutzt werden können. Durch den Einsatz solch einer Software ist es Unternehmen möglich auf zusätzliche, aufschlussreiche Informationen zurückzugreifen, die eigene Zielgruppe noch besser zu erreichen und potentielle Käufer zu generieren. Wie in allen großen Projekten ist eine vorausschauende Planung mit eindeutiger Zieldefinition auch für Vorhaben im Bereich der Bilderkennung unabdingbar. Häufig finden Konzepte deswegen zuerst innerhalb der Forschung und Entwicklung eines Unternehmens statt, da für das perfekte Ergebnis häufig mehrere Optimierungsschleifen notwendig sind. Ist die Software erfolgreich umgesetzt, profitieren sowohl Konsumenten als auch Unternehmer erheblich von den Vorteilen. In Folge dessen erscheint die Implikation von Bilderkennungssoftware in jedem Falle lohnenswert und verspricht großartige Möglichkeiten.

 

Der Autor

Bastian Keil verantwortet bei IronShark Bildverarbeitungs- und Machine Learning Projekte und ist als Prokurist auch in der Geschäftsleitung tätig. Er ist Diplom-Informatiker und leitet in den über 11 Jahren bei IronShark anspruchsvolle Projekte mit Objekt-, Menschen- und Bilderkennungstechnologien.

IronShark ist Aussteller an der topsoft Fachmesse 2019. Stand E15