From 1e2f38365f1500e1474fc8d0a37533799bcd9032 Mon Sep 17 00:00:00 2001
From: Andreas Buzer <andreas.buzer@student.reutlingen-university.de>
Date: Wed, 5 Jun 2024 12:20:59 +0200
Subject: [PATCH] adjusted cell type and removed invisible space character
 \u200b

---
 CRM/Customer Churn Prediction/notebook.ipynb | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/CRM/Customer Churn Prediction/notebook.ipynb b/CRM/Customer Churn Prediction/notebook.ipynb
index 5d972c5..9bae499 100644
--- a/CRM/Customer Churn Prediction/notebook.ipynb	
+++ b/CRM/Customer Churn Prediction/notebook.ipynb	
@@ -17,7 +17,7 @@
    ]
   },
   {
-   "cell_type": "code",
+   "cell_type": "markdown",
    "execution_count": null,
    "metadata": {
     "include": true,
@@ -59,7 +59,7 @@
    "cell_type": "markdown",
    "metadata": {
     "include": true,
-    "paragraph": "Datenvorbereitung​"
+    "paragraph": "Datenvorbereitung"
    },
    "source": [
     "Zunächst wird der Typ der Daten nach dem Einlesen in das Notebook überprüft. Einlesefehler werden entsprechend korrigiert. Danach werden die einzelnen Kundenmerkmale einer deskriptiven Analyse unterzogen. Damit lässt sich der Zusammenhang zur Zielvariable Kundenabwanderung visuell darstellen. Auf der Grundlage einer Korrelationsanalyse werden die Zusammenhänge zwischen Kundenmerkmalen und der Zielvariable untersucht. Kundenmerkmale die keinen Mehrwert bieten werden entfernt (= Dimensionsreduktion). Die Ausgewogenheit des Datensatzes in Bezug auf die Zielvariable wird grafisch dargestellt. Die Kunden mit Abwanderung machen etwa 27 % des gesamten Datensatzes aus, während loyale Kunden etwa 73% ausmachen. Daher liegt ein unausgewogener Datensatz vor. Anschließend werden die kategorialen Werte umgewandelt (= Bildung von Dummy Variablen). Die einzelnen Kundenmerkmale werden auf Multikollinearität und statistische Signifikanz geprüft. Schließlich werden alle Kundenmerkmale auf ein gemeinsames Messniveau gebracht (= Standardisierung). Durch ein Undersampling wird die Unausgewogenheit des Datensatzes ausgeglichen. Abschließend werden Trainings- und Testdaten gebildet."
-- 
GitLab