Alle Beiträge, Technologien & Entwicklung
Schreibe einen Kommentar

Die digitalen Kundenberater im Web

Welche Versicherung schließe ich ab?“, „Welches Buch passt zu meinem Lieblingsgenre?“ oder „Zu welchem Zeitpunkt soll ich meine Aktien verkaufen?“. Jedem sind solche Entscheidungssituationen wohl bekannt, in denen man gewöhnlich nach einem Rat im Freundeskreis oder in vertrauter Umgebung sucht. Sind die Vorlieben und Verhaltensweise einer Person bekannt und gegebenenfalls Erfahrung zum gesuchten Sachverhalt vorhanden, so können i.d.R. gute personenbezogene Ratschläge ermittelt werden. Basierend auf dieser grundlegenden Strategie analysieren auch Onlineshops seit Jahren das digitale Kaufverhalten der Kunden, um systematisch und automatisiert Produktempfehlungen ermitteln zu können.

Doch woher weiß eine Software, welche Produkte für eine Person möglicherweise interessant sind? In diesem Artikel sollen einige technische Grundlagen vorgestellt werden, um einen Einblick in die Funktionsweise von Empfehlungsdiensten zu erhalten.

Empfehlungsdienste

Empfehlungsdienste (engl. Recommender Systems), sind softwarebasierte Applikationen zur Ermittlung von Vorschlägen und Empfehlungen für bestimmte Personen und Zielgruppen. Solche Systeme sind heutzutage in vielen Bereichen im Einsatz und auf manchen Plattformen gar nicht mehr wegzudenken. Den größten Verbreitungsgrad haben Empfehlungsdienste jedoch im E-Commerce. Diese Dienste übernehmen hierbei die Rolle eines digitalen Kundenberaters, da sie durch Informationsaufnahme des Kundenverhaltens die Interessen der Kunden lernen und somit gezielte Empfehlungen zu passenden Produkten machen können. Zum einen wird die Suche nach bestimmten Produkten erleichtert und zum anderen können Marktneuheiten zeitnah potenziellen Interessenten vorgestellt werden. Neben den Vorteilen für Kunden, profitieren auch die Unternehmen durch Recommender Systeme. Unternehmen wie Amazon haben gezeigt, dass durch den Einsatz von intelligenten Empfehlungsdiensten der Querverkauf (cross-selling) von Produkten angeregt wird, was letzten Endes zu einem höheren Umsatz führt.

Collaborative Filtering

Die Technik, die in diesem Blogbeitrag vorgestellt wird heißt Collaborative Filtering (CF) und gehört zu den ältesten und am häufigsten in der Praxis eingesetzten Methode. Wörtlich kann Collaborative Filtering als gemeinschaftliches oder kooperatives Filtern übersetzt werden, da sie auf dem Zusammenwirken mehrerer Benutzer des gleichen Systems beruht, die sich gegenseitig bei der Filterung von Informationen unterstützen. Die Daten dieser Benutzer werden dazu verwendet, um aus dem Gesamtbild jeder einzelnen Person gemeinsame Ähnlichkeiten und Muster zu erkennen. Die Philosophie dieses Ansatzes lautet: “Benutzer, die in der Vergangenheit gemeinsame Interessen hatten, werden diese auch weiterhin in der Zukunft haben”, oder auch anders gesagt: “Ein Benutzer bewertet ein neues Produkt so, wie er ähnliche Produkte schon früher bewertet hat”. Es ist zu beachten, dass man grundsätzlich zwischen zwei Varianten des Collaborative Filtering unterscheidet: User-Based und Item-Based.

Bei User-Based Verfahren, werden zu einem Benutzer die ähnlichsten anderen Benutzer des gleichen Systems herausgefiltert, welche in der Literatur häufig als nearest neighbors (dt. nächstliegender Nachbarn) bezeichnet werden. Der Zielperson können neue Produkte vorgeschlagen werden, welche bei den ähnlichsten anderen Benutzern gefunden werden.

Abb. 1: User-Based Verfahren angewandt auf User 2

Abb. 1: User-Based Verfahren angewandt auf User 2

Für ein besseres Verständnis visualisiert Abbildung 1 ein einfaches Szenario, in dem für User 2 eine Empfehlung generiert werden soll. Da User 1 zwei Artikel mehr gemeinsam hat als User 3, weist dieser eine stärkere Ähnlichkeit zu User 1 auf und wird somit als der nächste Nachbar identifiziert. Als nächstes werden User 2 alle Artikel von User 1 empfohlen, welche von User 2 bislang noch unentdeckt sind, in diesem Fall nur Item 1.

Der Item-Based Algorithmus berechnet Empfehlungen, wie der Name schon sagt, aufgrund der Ähnlichkeiten zwischen Produkten und nicht zwischen Benutzern. Es stellt sich dabei die Frage, wie Produktähnlichkeit definiert wird? Zu beachten ist, dass CF basierte Techniken grundsätzlich keinerlei Produktinformationen, wie Farbe oder Genre, benötigen, sondern lediglich Präferenzen von Benutzern zu Produkten (z. B. 4 von 5 Sterne) . In diesem Sinn sind Produkte anderen Produkten ähnlich, wenn sie ähnliche Bewertungsvektoren aufweisen, siehe Abbildung 2.

Abb. 2: Item-Based Verfahren angewandt auf User 2

Abb. 2: Item-Based Verfahren angewandt auf User 2

Item 1 ähnelt Item 2, Item 3 und Item 4 am meisten, da diese von User 1 und User 2 gleichermaßen gut bewertet worden sind. Aufgrund der guten Bewertung von User 2 für Item 2-4, wird für Item 1 eine ähnlich gute Präferenz vorhergesagt und somit eine Empfehlung ausgeschrieben.

Content-Based Filtering

Inhaltsbasierte Filterungstechniken ermitteln Empfehlungen anhand von Ähnlichkeiten bei Produkteigenschaften. Dem Benutzer werden Produkte vorgeschlagen, die seinem Benutzerprofil entsprechen. Anders als bei den Collaborative Filtering Ansätzen werden hierbei keine Datensätze anderer Benutzer mit einbezogen, sondern nur die Daten einer Zielperson. In einem einleitenden Beispiel aus dem Buch Recommender Systems An Introduction von Dietmar Jannach et. al. wird sinngemäß gesagt, wenn Harry Potter ein Buch des Fantasy-Gernes ist und man weiß, dass Alice Fantasybücher schon immer gemocht hat, so ist das Buch Harry Potter eine durchaus gute Empfehlung für Alice, falls Alice diesen Artikel noch nicht besitzt. Für solche Empfehlungsarten werden zweierlei Informationen benötigt: Charakteristische Produkteigenschaften bzw. Attribute und ein Benutzerprofil, welches die Interessen des Benutzers aus der Vergangenheit in Form von Keywords enthält. Die Aufgabe der Recommendation Engine besteht nun darin, Produkte zu finden, deren Produkteigenschaften mit den Interessen aus dem Benutzerprofil am besten übereinstimmen.

Eigene Implementierung

Gemeinsam mit dem Competence Center Wirtschaftsinformatik der Hochschule München (CCWI) und Industriepartnern wurde eine plattformunabhängige und auf Open-Source basierende Softwarelösung entwickelt, um Empfehlungen auf Basis von Produktbewertungen ermitteln zu können. Konkret wurde hierbei ein Empfehlungsserver realisiert, welcher als Datengrundlage Produktbewertungen entgegennimmt, um daraus personalisierte Empfehlungen berechnen zu können. Dabei können Onlinehändler diesen Dienst einfach per REST-Webservice Schnittstellen in ihre Webanwendung integrieren.

Die Empfehlungssoftware unterstützt viele verschiedene Verfahren und Algorithmen für die Ermittlung von Empfehlungen. Da die Qualität der Empfehlungen sehr stark von den quantitativen und qualitativen Bewertungsdaten sowie von einem passenden Algorithmus abhängt, müssen diverse Algorithmen und Feineinstellungen getestet werden. Um einen schnellen Überblick über die Auswirkung verschiedener Verfahren zu bekommen, wurde eine Weboberfläche für den Empfehlungsserver implementiert, siehe Bild “Recommender Lab” ganz oben.

Publikation

In der Fachzeitschrift HMD Praxis der Wirtschaftsinformatik wurde ein umfangreicher Artikel mit dem Titel Nutzung von Apache Mahout für eine leichtgewichtige Empfehlung auf der Basis von Produktbewertungen veröffentlicht. In dieser Publikation wird die eigenständige Softwarelösung zur Ermittlung von leichtgewichtigen Empfehlungen tiefgründiger anhand von Details zur Architektur und Implementierung vorgestellt.

Hinterlassen Sie eine Antwort

Ihre E-Mail-Adresse wird nicht veröffentlicht.