Der eigentliche Wert von Computer Vision im Einzelhandel liegt in der Umwandlung von erfassten Bildern in verwertbare Erkenntnisse.
Zuvor haben wir Faktoren wie Genauigkeit und Vollständigkeit als entscheidend für die Datenqualität diskutiert, wenn es um In-Store-Daten geht, die von Computer-Vision-Lösungen erzeugt wurden.
Aber wie wandelt Computer Vision eigentlich Bilder in Geschäften in aussagekräftige quantitative Daten für den Einzelhandel und die Konsumgüterindustrie um? Welche Werkzeuge und Techniken kommen zum Einsatz, wenn Bilder verwendet werden, um reale Ladenbedingungen zu verstehen?
Digitalisierung eines physischen Geschäfts
Der Hauptvorteil des Einsatzes von Computer Vision für den Einzelhandel liegt in der Fähigkeit, eine Version der realen Bedingungen im Laden zu erstellen, die weitaus genauer ist als manuelle Audits. Da dieser Ansatz auf das Regal und die Auslagen ausgerichtet ist, liefert er mehr Daten zu Metriken wie Regalverfügbarkeit und Regalanteil als Scannerdaten.
Damit dies funktioniert, ist eine ganzheitliche, digitalisierte Darstellung des Ladens erforderlich, um die erfassten Bilder in umsetzbare Erkenntnisse und KPI-Berechnungen umzuwandeln, die als Entscheidungsgrundlage dienen können. Eine hochmoderne Computer-Vision-Plattform kann fortschrittliche Bildzusammensetzungs- und Geometrietechniken nutzen, um den physischen Einzelhandel zu digitalisieren.
- Zusammenfügen von Panoramabildern
Wenn Sie jemals virtuelle Spaziergänge machen, Sehenswürdigkeiten erkunden oder Geschäfte, Restaurants und Hotels in irgendeiner Straße der Welt finden wollen, werden Sie die Google Street View-Funktion von Google Maps nutzen. Diese Funktion bietet Panoramablicke von verschiedenen Positionen entlang vieler Straßen auf der ganzen Welt. Die meisten Aufnahmen werden mit dem Auto gemacht, aber was zu sehen ist, ist ein Panorama aus zusammengesetzten Bildern.
Um die Bedingungen in einem Geschäft mit Hilfe von Computer Vision zu verstehen, müssen zahlreiche Bilder über Hunderte von Gängen hinweg aufgenommen werden, die jeweils viele Produkte enthalten. Eines der überzeugendsten Mittel zur Visualisierung von Daten dieser Art sind Multiperspektiven-Panoramen.
Vereinfacht ausgedrückt läuft dieser Prozess darauf hinaus, dass einzelne Bilder, die von verschiedenen Blickwinkeln und Geräten aufgenommen wurden, extrahiert und dann zu einem endgültigen Panorama zusammengefügt werden. Dieser Prozess des Mosaikierens - oder Zusammenfügens - ist im Einzelhandel rechnerisch komplexer als in anderen Bereichen.
In einer nicht-einzelhandelsbezogenen Umgebung ist es beispielsweise etwas einfacher, Gesichter in einer Menschenmenge zu erkennen, da es keine Gesichter gibt, die sich wiederholen. In einem Einzelhandelsgeschäft jedoch, in dem identische Produkte oft nebeneinander stehen, erfordert der Prozess der visuellen Rekonstruktion des Regals und die Sicherstellung, dass es keine Überschneidungen oder Duplikate gibt, eine auf fortschrittlichen Algorithmen basierende Stitching-Engine.
Die neuesten Innovationen bei der Erfassung von Filialdaten nutzen auch die Augmented-Reality-Technologie, die den Prüfern genau anzeigt, welche Teile des Regals erfasst wurden, und so den Prozess der Zusammenführung erheblich beschleunigt.
- Identifizierung von Ort und Größe der Produkte anhand der Geometrie
Hersteller von Konsumgütern stützen sich häufig auf eine Reihe von Kennzahlen oder KPIs, um ihre Markenpräsenz zu verstehen, z. B. den linearen Anteil am Regal. Diese Kennzahl bezieht sich auf den prozentualen Anteil der physischen Regallänge, den eine Marke in einer Kategorie an der gesamten Regallänge in Zoll oder Metern einnimmt.
Das Trax-System nutzt fortschrittliche geometrische Techniken, um den Winkel und den Abstand zum Regal, von dem aus das Foto aufgenommen wurde, zu berücksichtigen. Auf diese Weise lässt sich die genaue Position jedes Produkts im Regal ermitteln, selbst bei gestapelten Artikeln. So kann zum Beispiel eine Coca-Cola 600 ml in Fach 4, Regal 2, als vierter Artikel von rechts oben auf dem Stapel identifiziert werden.
Für die Berechnung von Metriken wie dem linearen Anteil am Regal ist die Kenntnis der Größe des einzelnen Produkts ebenso wichtig wie sein Standort. Um jedes Produkt werden enge rechteckige Masken erstellt, und die genaue Menge des belegten Regalplatzes wird mithilfe von Deep-Learning-Algorithmen berechnet, die auf bekannten Dimensionen einer kleinen Stichprobe von Produkten trainieren.
- Grundlage für die Durchführung komplexer Regalmessungen
Das Bildstitching und die Geometrie-Engines bilden das gesamte Regal digital nach, aber die Daten müssen noch in aussagekräftige Erkenntnisse umgesetzt werden.
Ein flexibles und agiles KPI-Berechnungsmodul arbeitet mit aggregierten multidimensionalen Datenpunkten, um verwertbare Erkenntnisse über verschiedene Ladenparameter wie Produktpräsenz, Position, Planogramm, Promotions und Preisgestaltung zu liefern.
Die berechneten Metriken liefern Antworten auf kritische Fragen, die sich Marken und Einzelhändler stellen, z. B.: Erhalte ich meinen fairen Anteil am Regal? Sind meine wichtigsten Artikel im Laden? Habe ich die richtigen Facings? Diese Erkenntnisse werden dann über Dashboards bereitgestellt, die auf die verschiedenen Benutzerrollen zugeschnitten sind - von Außendienstmitarbeitern bis hin zu Vorgesetzten und Managern in der Zentrale.
Hochentwickelte Algorithmen, die Panorama-Stitching und geometrische Berechnungen durchführen, sind unerlässlich, um die Bedingungen in den Geschäften genau zu erfassen und in verwertbare Erkenntnisse umzusetzen.
In diesem Video können Sie einen Blick unter die Haube der Trax Computer Vision Plattform werfen.