Kurzübersicht
Netflix, Amazon, Zalando und Co setzen bei der Kundenbindung vor allem auf eins: gute, auf den Nutzer zugeschnittene Empfehlungen für neue Produkte, Filme, Kleidung etc. Dazu entwickeln diese Unternehmen Empfehlungssysteme, die möglichst gut vorhersagen können, was dem jeweiligen Nutzer gefallen könnte.
Um das eigene Empfehlungssystem weiter zu verbessern richtete Netflix 2006 eine Challenge aus: Das Team, was mindestens 10 % genauer vorhersagen kann, welche Filme einem Nutzer gefallen, hatte Chancen auf den Hauptpreis von 1 Million USD!
Zu diesem Lernmodul existieren zwei verschiedene Varianten:
Variante 1:
Dauer: ab 5 Stunden (inkl. Mittagspause)
Inhalte: Data Science, Skalarprodukt, Vektoren, Matrizen, Machine Learning
Vorwissen: Funktionsbegriff, Differentialrechnung, lineare Gleichungssysteme
Teilnehmer: Mathematikkurse ab Klasse 10
Erstellt von: Sarah Schönbrodt
Anmeldung: Termine können individuell über dieses Formular vereinbart werden.
Variante 2:
Dauer: ab 5 Stunden (inkl. Mittagspause)
Inhalte: Data Science, Vektoren, Abstand zwischen Vektoren, Machine Learning
Vorwissen: Vektoren, Skalarprodukt, Mittelwert, Betragsfunktion, trigonometrische Funktionen
Teilnehmer: Mathematikkurse ab Klasse 10
Erstellt von: Lisa Rantzau, Sarah Schönbrodt
Anmeldung: Termine können individuell über dieses Formular vereinbart werden.
Stundenverlaufsplan
Phase |
Thema |
Inhalt |
Schulbezug |
weitere math. Inhalte |
Medien/ Materialien |
Zeit (Min.) |
Einstieg + Technikeinführung |
Die Problem- |
Einstieg in Empfehlungssysteme und die Netflix Challenge |
- |
- |
Präsentationsfolien |
15
10 |
Erarbeitung
|
Datenanalyse |
Ein- und Überblick über den Netflixdatensatz |
Verständnis von Daten, Mittelwert, Standardabweichung |
- |
AB1-SuS |
30 – 40 |
Sicherung |
Erkenntnisse der Analyse des Datensatzes diskutieren |
|
|
Präsentationsfolien |
15 |
|
Erarbeitung
|
Das Modell |
Zusammenhänge in Bewertungsdaten erkennen, Idee der Faktorisierung erarbeiten |
Verständnis von Daten, Vektoren, Skalarprodukt |
Matrizen, Matrix-Multiplikation |
AB2-SuS |
30 |
Sicherung |
|
Diskussion erfasste Zusammenhänge in den Daten, Sicherung der Faktorisierungsidee |
|
|
Präsentationsfolien |
10 |
Erarbeitung
|
Fehlerfunktionen |
Bestimmung einer Zerlegung per Hand, Bewertung der Güte einer gefundenen Zerlegung (Faktorisierung) |
|
Summe der Fehlerquadrate |
AB3-SuS |
30 - 40 |
Sicherung |
|
|
|
Präsentationsfolien |
10 |
|
Erarbeitung
|
Die Optimierung |
Entwicklung eines Optimierungsverfahrens zur Bestimmung einer Faktorisierung
|
Ableitungen, Minimierungsproblem, lineares Gleichungssystem
|
Funktionen in zwei Variablen, Gradient |
AB4-SuS |
50 - 60 |
Erarbeitung
|
Die Optimierung |
Anwendung des Optimierungsverfahrens von AB 4 (Langversion |
AB4-short-SuS |
20 |
||
Sicherung |
|
- |
- |
Präsentationsfolien |
10 |
|
Erarbeitung
|
Anwendung auf Netflixdatensatz |
Verständnis von Trainings- und Testdaten
|
Interpretation und kritische Reflexion der Ergebnisse |
Prinzip des Maschinellen Lernen |
AB5-SuS |
20 - 25 |
Sicherung + Abschlussdiskussion
|
Kritische Diskussionen |
Vergleich der erhaltenen Ergebnisse auf dem Netflixdatensatz Gesellschaftliche Diskussion der Nutzung von Empfehlungssystemen
|
- |
- |
Präsentationsfolien |
20 |
Zusatzmaterial |
||||||
Zusatzblatt: Skalarprodukt (verlinkt auf AB2) |
Mathematische Begründung für größere bzw. kleinere vorhergesagte Bewertungen |
Skalarprodukt, Cosinus, Vektoren, Winkel |
- |
AB_SKP-SuS |
|
|
Zusatzblatt: Fehlermaße |
Vergleich verschiedener Fehlerfunktionen |
Funktionen / Funktionsgraphen |
Optimierung: Eigenschaften der Zielfunktion |
AB_Fehlermasse-SuS |
|
|
Zusatzblatt: Regularisierung (verlinkt auf AB4) |
Regularisierung – Vermeidung von Überanpassung an die Trainingsdaten |
Funktionsgraphen |
Optimierung: Existenz und Eindeutigkeit einer Lösung |
AB_Regularisierung-SuS |
|
|
Zusatzblatt: eigene Empfehlungen (verlinkt auf AB 5) |
Eigene Bewertungen abgeben und individuelle Empfehlungen berechnen |
- |
- |
AB_myRecommendations-SuS |
|