XPLN setzt auf KI und Machine Learning

30. Juli 2020

Seit mehreren Monaten beschäftigt sich unser Data-Science- und Entwicklungs-Team mit erweiterten Geschäftslogiken für das Matching von Artikeln auf Wettbewerber-Shops auf Basis von Künstlicher Intelligenz (KI) und Machine Learning (ML). Eine Zuweisung von Artikeln ohne klare Primärschlüssel, wie z.B. EAN oder GTIN, zu Artikeln unserer Kunden – im Besonderen im Bereich von Eigenmarken –ermöglicht einen erweiterten Spielraum auch in Szenarien wie Sortimentsplanung oder Produktentwicklung. Aber auch im Bereich Dynamic Pricing ist das korrekte, verifizierte Matching der Artikel eine Schlüsseltechnologie, da nicht auf allen Plattformen mit eindeutigen Identifiern Daten erhoben werden können.  

Aktuell stellen unsere Datenbanken über 15 Millionen Produkte aus 100.000 Onlineshops in 25 Ländern zur Verfügung. Durch die Erweiterung der Technologie steigen diese Zahlen stetig. Im Folgenden und in den kommenden Wochen möchten wir euch noch etwas mehr zum Thema Matching mittels KI und ML berichten.   

Matching-Qualität für bessere Insights

Eine der größten Herausforderungen im Price Monitoring ist die Zuweisung von Produkten aus verschiedenen Plattformen und Datenquellen auf eindeutige Produkte. Das Crawling der Produktdaten als initialer Prozess zur Datenerhebung wird erst durch ein intelligentes Produkt-Matching und die Verifizierung der erhobenen Artikeldaten zu wertvollen Insights für Onlinehändler. Die bereitgestellten Preis- und Produktdaten werden täglich oder auch stündlich zur Verfügung gestellt, um ein regelbasiertes Dynamic Pricing zu ermöglichen, Umsätze zu optimieren oder Trends zu erkennen.

Standard: Auf Basis von eindeutigen Primärschlüsseln wie EAN, PZN und GTIN erfolgen automatisierte Matchings

Höhere Identquoten dank Machine Learning

Die Produkt- und Kategoriepalette nimmt immer mehr zu und häufig sind keine eindeutigen Primärschlüssel ausgewiesen. Um diese Angebotsvielfalt abzubilden, erweitern wir unsere Lösung und bieten nun Zuordnungen automatisiert mit einem mehrstufigen Machine Learning Prozess an.

Beim Matching ohne verfügbare Primärschlüssel werden maximal verfügbare Datenpunkte ermittelt und deren Übereinstimmung auf Ebene von Kategorien, Merkmalen und Attributen automatisiert geprüft und zugewiesen. Textmining-Tools und Bilderkennungs-Algorithmen suchen nach Ähnlichkeiten in der Produktdarstellung.

Smart Score bewertet KI-basiert

Das von uns entwickelte Smart Scoring basiert auf Machine Learning und verifiziert das Matching der erhobenen Daten erneut auf Inkonsistenzen auf der Text- und Bildebene.

Getrennt nach Datentypen werden numerische Daten bewertet wie z.B. Länge, Weite, Größe sowie die Zugehörigkeit zu Produkt-Bundles. In einem automatisierten Prozess werden diese Daten normalisiert und mit einem lernenden Scorewert bewertet. Kombinierte Produktinformationen mit ergänzenden Angaben, wie z.B. Inhaltsstoffen werden nach Datenpunkten ebenfalls normalisiert.

Ein ML-basiertes Bewertungsmodell analysiert auf semantischer und syntaktischer Ebene die Zuordnung auf Artikelebene. Erst ab einem definierten Schwellwert an übereinstimmenden Datenpunkten ist eine Nutzung der Daten möglich. Die finale Zuordnung wird vor Publikation durch eine mehrschichtige Entscheidungslogik erneut verifiziert und kann auf Wunsch in einem zusätzlichen hybriden Verfahren auch noch durch unser Data-Service-Team geprüft werden.

Nicht-Treffer werden zudem mit einem Deep-Learning neuronalen Netzwerk ausgewertet. Mit historisch erlernten Wahrscheinlichkeiten aus Millionen von Matches werden auf dieser Ebene Produkte zugewiesen, um die Identquote zusätzlich zu erhöhen.

Der KI-basierte Smart Score bewertet ein Produktmatching, welches an Onlinehändler oder Hersteller ausgespielt werden kann.

Mehrstufiges ML-basiertes Matching mit Smart-Scoring

Schon jetzt können wir eine hohe Anzahl an positiven Effekten bei den Matching-Ergebnissen von Sortimenten ohne Primärschlüssel feststellen. Erstmalig können z.B. Eigenmarken mit anderen Eigenmarken oder auch Marken innerhalb derselben Kategorie verglichen werden.

Über das reine Produkt-Matching für ein deutlich verbessertes automatisiertes Repricing sind so auch aggregierte Sortimentsvergleiche mit dem Wettbewerbern möglich und Trendbarometer für deren Entwicklung in unterschiedlichen Onlinekanälen produzierbar. Diese gewonnen Erkenntnisse können direkt in die Produktentwicklung oder in die Sortimentsplanung einfließen.