From 9d7e7c499d3b500dbd1ce4dd641ba1dc27cd8f5c Mon Sep 17 00:00:00 2001 From: Manuel <Manuelfrank1202@gmail.com> Date: Fri, 21 Jun 2024 12:12:12 +0200 Subject: [PATCH] Tags added --- .../notebook.ipynb | 215 ++++++++++++++++-- 1 file changed, 198 insertions(+), 17 deletions(-) diff --git a/Online Retail/Size prediction for online fashion retailer/notebook.ipynb b/Online Retail/Size prediction for online fashion retailer/notebook.ipynb index 6ccce41..10fca0c 100644 --- a/Online Retail/Size prediction for online fashion retailer/notebook.ipynb +++ b/Online Retail/Size prediction for online fashion retailer/notebook.ipynb @@ -1,7 +1,200 @@ { "cells": [ { - "attachments": {}, + "cell_type": "markdown", + "metadata": { + "tags": [] + }, + "source": [ + "## Title" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Title" + ] + }, + "source": [ + "Vorhersage der Kleidergrößen von Kunden" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Teaser" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Teaser" + ] + }, + "source": [ + "Rücksendungen sind im Modehandel ein kostspieliges Problem, oft mit Rückgabequoten von bis zu 50%. Viele Kunden bestellen mehrere Größen, um die richtige Größe zu finden. Mit dem Datenmodell, das auf einem Datensatz von ModCloth basiert, können Modehändler nun präzise Größenempfehlungen geben. Das Modell nutzt Körpermerkmale wie Taillenumfang, Größe und Hüftumfang, um die perfekte Größe vorherzusagen. Eine logistische Regression zeigte, dass das Modell etwa 73,7% der Variabilität in den Rücksendungen erklären kann, was zu konsistenten Vorhersagen führt. Durch den Einsatz dieses Modells können Rücksendungen reduziert werden. Diese Lösung lässt sich am besten in ein bestehendes CRM-Systeme integrieren und erhöht sowohl die Kundenzufriedenheit als auch die Effizienz des Unternehmens." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Business" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Business" + ] + }, + "source": [ + "Rücksendungen sind Teil des Geschäftsmodells vieler Modegeschäfte. Die Rückgabequote der Unternehmen liegen oft bei etwa 50 %, was das Unternehmen unnötig viel Geld und Aufwand kostet. Hinzu kommt: Gerade in der Modebranche gibt es viele Kunden, die schon vor ihrer Bestellung wissen, dass sie den Artikel mit hoher Wahrscheinlichkeit zurückschicken werden. Sie bestellen zum Beispiel ein und dasselbe Hemd in verschiedenen Größen, weil sie nicht sicher sind, welches passen wird. Mit dieser Demo kann es möglich gemacht werden, Kunden anhand von Körpermerkmalen direkt die passende Größe vorzuschlagen. Dies trägt zur Kundenzufriedenheit bei und senkt die Quote der Retouren." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Daten" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Daten" + ] + }, + "source": [ + "Der Datensatz für diese Demo wurde auf der Kaggle-Plattform heruntergeladen und stammt von ModCloth, einem Online-Geschäft für Damenbekleidung. Die Daten beziehen sich auf tatsächlich verkaufte Kleidungsstücke und enthalten zusätzliche Informationen über die Passform bei den Kunden. Der Datensatz umfasst mehrere Merkmale, darunter Taillenumfang, Größe, Qualität, Körbchengröße, Hüftumfang, BH-Größe, Brustumfang, Kategorie, Länge, Passform, Schuhgröße, Schuhbreite, etc. Ziel ist es, anhand dieser Merkmale Muster und Zusammenhänge zu erkennen, die Aufschluss darüber geben, wie gut die Kleidung den Kundenerwartungen entspricht und wie diese Informationen zur Verbesserung der Produktangebote und der Kundenzufriedenheit genutzt werden können." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Datenvorbereitung" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Datenvorbereitung" + ] + }, + "source": [ + "Nach dem Einlesen des Datensatzes in das Notebook wird zunächst der Typ der Daten überprüft und Einlese Fehler werden korrigiert. Anschließend werden die einzelnen Merkmale der verkauften Kleidung einer deskriptiven Analyse unterzogen, um den Zusammenhang zur Zielvariable \"Passform\" visuell darzustellen. Mittels einer Korrelationsanalyse werden die Beziehungen zwischen den verschiedenen Kundenmerkmalen und der Zielvariablen untersucht. Merkmale, die keinen Mehrwert bieten, werden entfernt (Dimensionsreduktion). Danach wird die Ausgewogenheit des Datensatzes hinsichtlich der Zielvariablen grafisch dargestellt. Da die Passform \"just right\" etwa 74% der Daten ausmacht und \"nicht passend\" etwa 26%, handelt es sich um einen unausgewogenen Datensatz. Die kategorialen Werte werden dann in Dummy-Variablen umgewandelt. Die Merkmale werden auf Multikollinearität und statistische Signifikanz geprüft und anschließend standardisiert. Die Unausgewogenheit des Datensatzes wird durch Undersampling ausgeglichen, bevor Trainings- und Testdaten erstellt werden." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Datenmodell" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Datenmodell" + ] + }, + "source": [ + "Als Datenmodell wird eine logistische Regression verwendet. Dies bietet sich zur Klassifikation der Retouren auf eine binäre Zielvariable (= Retouren) an. " + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Evaluation" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Evaluation" + ] + }, + "source": [ + "Es wurde eine Merkmalsskalierung durchgeführt, um sicherzustellen, dass alle Merkmale im gleichen Maßstab vorliegen. Das trainierte Regressionsmodell wurde mit den Trainingsdaten evaluiert, dies deutet darauf hin, dass das Modell etwa 73,7% der Variabilität in den abhängigen Variablen erklären kann. Die Leistung des Modells wurde auch mit den Testdaten bewertet wobei die selben Werte herauskamen. Zusätzlich wurde eine Vorhersage auf den Testdaten durchgeführt und mit den tatsächlichen Werten verglichen. Ein Diagramm zeigt die ersten 50 Vorhersagen im Vergleich zu den tatsächlichen Werten. Darüber hinaus wurde eine Regressionsanalyse durchgeführt, um die Beziehung zwischen den tatsächlichen und den vorhergesagten Werten grafisch darzustellen. Insgesamt zeigt das Modell eine solide Leistung und kann somit als Modell verwendet werden." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Umsetzung" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "BusinessUnderstanding", + "slideshow": { + "slidetype": "" + }, + "tags": [ + "Umsetzung" + ] + }, + "source": [ + "Die Umsetzung bzw. Einbindung des Datenmodells bietet sich in CRM-Systemen an. Durch die Berücksichtigung von Körpermerkmalen des Kunden kann das System automatisch präzise Vorhersagen bezüglich seiner Kleidergrößen treffen. Diese Herangehensweise ermöglicht es, Retouren aufgrund von Bestellung mehrerer Größen oder fehlerhafter Bestellungen zu reduzieren. " + ] + }, + { "cell_type": "markdown", "metadata": { "editable": true, @@ -15,7 +208,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": { "editable": true, @@ -35,7 +227,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -43,7 +234,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": { "editable": true, @@ -64,7 +254,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -91,7 +280,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -292,7 +480,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -1118,7 +1305,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -1126,7 +1312,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -1830,7 +2015,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -2421,7 +2605,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -2652,7 +2835,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -2679,7 +2861,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -2700,7 +2881,6 @@ ] }, { - "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ @@ -2827,10 +3007,11 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.12.3" + "version": "3.7.4" }, - "skipNotebookInDeployment": true, - "title": "Size prediction for online fashion retailer" + "tags": [ + "Teaser" + ] }, "nbformat": 4, "nbformat_minor": 4 -- GitLab