From 2e41ca8393a8b06e6835431002401fe05e3ddd46 Mon Sep 17 00:00:00 2001 From: Philgabsschon <philippandermann@yahoo.com> Date: Wed, 19 Jun 2024 16:18:48 +0200 Subject: [PATCH] added tags to retail store forcast notebook --- .../notebook.ipynb | 3 +- .../notebook_Multiple_Linear_Regression.ipynb | 96 +++++++++++++++++-- 2 files changed, 92 insertions(+), 7 deletions(-) diff --git a/CRM/Customer Satisfaction Airlines/notebook.ipynb b/CRM/Customer Satisfaction Airlines/notebook.ipynb index d89116c..8665d4b 100644 --- a/CRM/Customer Satisfaction Airlines/notebook.ipynb +++ b/CRM/Customer Satisfaction Airlines/notebook.ipynb @@ -16,6 +16,7 @@ ] }, { + "attachments": {}, "cell_type": "markdown", "metadata": { "editable": true, @@ -27,7 +28,7 @@ "tags": [] }, "source": [ - "Der Datensatz besteht aus den Angaben von Kunden, die bereits mit ihnen geflogen sind. Das Feedback der Kunden zu verschiedenen Kontexten und deren Flugdaten wurde konsolidiert. Der Hauptzweck dieses Datensatzes besteht darin, vorherzusagen, ob ein zukünftiger Kunde angesichts der Details der anderen Parameterwerte mit seinem Service zufrieden sein würde. Auch die Fluggesellschaften müssen wissen, auf welchen Aspekt der von ihnen angebotenen Dienstleistungen mehr Wert gelegt werden muss, um zufriedenere Kunden zu generieren." + "Der Datensatz besteht aus den Angaben von Kunden, die bereits mit ihnen geflogen sind. Das Feedback der Kunden zu verschiedenen Kontexten und deren Flugdaten wurde konsolidiert. Der Hauptzweck dieses Datensatzes besteht darin, vorherzusagen, ob ein zukünftiger Kunde angesichts der Details der anderen Parameterwerte mit seinem Service zufrieden sein würde. Auch die Fluggesellschaften müssen wissen, auf welchen Aspekt der von ihnen angebotenen Dienstleistungen mehr Wert gelegt werden muss, um zufriedenere Kunden zu generieren.!" ] }, { diff --git a/Forecast/Sales Forecast for retail store/notebook_Multiple_Linear_Regression.ipynb b/Forecast/Sales Forecast for retail store/notebook_Multiple_Linear_Regression.ipynb index 86e3fe9..6dd6c3f 100644 --- a/Forecast/Sales Forecast for retail store/notebook_Multiple_Linear_Regression.ipynb +++ b/Forecast/Sales Forecast for retail store/notebook_Multiple_Linear_Regression.ipynb @@ -8,10 +8,19 @@ ] }, { + "attachments": {}, "cell_type": "markdown", - "metadata": {}, + "metadata": { + "editable": true, + "include": true, + "paragraph": "Business", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, "source": [ - "A retailer needs a very high turnover and just-in-time delivery of products to be successful. For this, very precise forecasts are needed, which allow exact statements about which stores in which departments make how much turnover per week. The question is therefore as follows: What is the weekly sales forecast for all stores of a fictitious store if we take into account the data of the last three years, demographic information (CPI, Unemployment, Temperature, etc.)? Deriving from this, what then is the sales per week per department within one of these stores?" + "Der Datensatz besteht aus den Angaben von Einzelhandelsgeschäften. Das Feedback und die Umsatzzahlen zu verschiedenen Produkten und Zeiträumen wurden konsolidiert. Der Hauptzweck dieses Datensatzes besteht darin, vorherzusagen, ob ein zukünftiger Monat angesichts der Details der anderen Parameterwerte höhere oder niedrigere Umsätze haben wird." ] }, { @@ -22,10 +31,19 @@ ] }, { + "attachments": {}, "cell_type": "markdown", - "metadata": {}, + "metadata": { + "editable": true, + "include": true, + "paragraph": "Daten", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, "source": [ - "The data used for the notebook is divided into three files. They contain different features and the common attribute stores. " + "Der Datensatz dieser Demo stammt von verschiedenen Einzelhandelsgeschäften. Die Daten enthalten Details zu Umsätzen, Produktkategorien, Verkaufszahlen und anderen relevanten Parametern. Diese Informationen werden verwendet, um den Umsatz basierend auf historischen Daten vorherzusagen und zu analysieren." ] }, { @@ -1720,6 +1738,21 @@ "# 3. Data Preparation" ] }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "Datenvorbereitung", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, + "source": [ + "Im Notebook werden die Daten in mehreren Schritten systematisch vorbereitet. Zunächst werden die notwendigen Bibliotheken geladen, um die Datenverarbeitung und -visualisierung zu ermöglichen. Die Daten werden aus einer CSV-Datei importiert. Nach dem Import erfolgt eine erste Inspektion der Daten, um deren Struktur und das Vorhandensein fehlender Werte zu überprüfen. Duplikate werden identifiziert und entfernt, ebenso wie fehlende Werte bereinigt werden, um eine vollständige Datengrundlage zu gewährleisten. Zur Analyse der Verteilung der numerischen Daten werden Histogramme erstellt. Die Korrelationen zwischen den numerischen Variablen werden mittels einer Korrelationsmatrix visualisiert, um die Beziehungen zwischen den Variablen zu erkennen. Kategoriale Variablen werden in numerische Codes umgewandelt, um sie für maschinelles Lernen nutzbar zu machen. Die Daten werden dann in Trainings- und Testdatensätze aufgeteilt, typischerweise im Verhältnis 80% zu 20%, um die Modellleistung zu validieren. Schließlich werden die Daten normalisiert, um einheitliche Skalen zu gewährleisten und die Modellgenauigkeit zu verbessern. Diese vorbereitenden Schritte sorgen dafür, dass die Daten optimal für die anschließende Analyse und Modellierung geeignet sind." + ] + }, { "cell_type": "code", "execution_count": 83, @@ -4290,6 +4323,21 @@ "## 4.1. Multiple Linear Regression Model" ] }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "Datenmodell", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, + "source": [ + "Als Datenmodell wird eine multiple lineare Regression verwendet. Dies bietet sich zur Vorhersage des Umsatzes auf Basis mehrerer Einflussfaktoren an." + ] + }, { "cell_type": "code", "execution_count": 155, @@ -4333,6 +4381,36 @@ "## 4.3. Test and Train Data" ] }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "Evalutaion", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, + "source": [ + "Für die Bewertung der Qualität der Vorhersage werden Metriken wie der Mean Squared Error (MSE) verwendet. Diese Metriken helfen dabei, die Genauigkeit des Modells zu bewerten und Verbesserungsmöglichkeiten zu identifizieren." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "editable": true, + "include": true, + "paragraph": "Umsetzung", + "slideshow": { + "slide_type": "" + }, + "tags": [] + }, + "source": [ + "Die Umsetzung bzw. Einbindung des Datenmodells bietet sich in Verkaufsprognose-Systemen an. Auf Basis historischer Verkaufsdaten kann eine Vorhersage über zukünftige Umsätze getroffen werden. Auf diese Weise lässt sich vorhersagen, wie verschiedene Produkte und Kategorien sich in zukünftigen Zeiträumen entwickeln könnten, um strategische Entscheidungen zu treffen." + ] + }, { "cell_type": "code", "execution_count": 157, @@ -5332,8 +5410,14 @@ "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", - "version": "3.11.5" - } + "version": "3.12.3" + }, + "branche": "Handel", + "Funktion": "Vertrieb", + "repoLink": "https://gitlab.reutlingen-university.de/ki_lab/machine-learning-services/-/tree/main/Forecast/Sales%20Forecast%20for%20retail%20store?ref_type=heads", + "skipNotebookInDeployment": false, + "teaser": "In diesem Notebook analysieren wir den Umsatz von Einzelhandelsgeschäften anhand eines Multiple Linear Regression Modells. Die Problemstellung besteht darin, die Schlüsselfaktoren für den Umsatz der Geschäfte zu identifizieren und vorherzusagen.", + "title": "Umsatzvorhersage und Analyse für Einzelhandelsgeschäfte" }, "nbformat": 4, "nbformat_minor": 4 -- GitLab