From 1e2f38365f1500e1474fc8d0a37533799bcd9032 Mon Sep 17 00:00:00 2001
From: Andreas Buzer <andreas.buzer@student.reutlingen-university.de>
Date: Wed, 5 Jun 2024 12:20:59 +0200
Subject: [PATCH] adjusted cell type and removed invisible space character
 \u200b

---
 CRM/Customer Churn Prediction/notebook.ipynb | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/CRM/Customer Churn Prediction/notebook.ipynb b/CRM/Customer Churn Prediction/notebook.ipynb
index 5d972c5..9bae499 100644
--- a/CRM/Customer Churn Prediction/notebook.ipynb	
+++ b/CRM/Customer Churn Prediction/notebook.ipynb	
@@ -17,7 +17,7 @@
    ]
   },
   {
-   "cell_type": "code",
+   "cell_type": "markdown",
    "execution_count": null,
    "metadata": {
     "include": true,
@@ -59,7 +59,7 @@
    "cell_type": "markdown",
    "metadata": {
     "include": true,
-    "paragraph": "Datenvorbereitungâ€‹"
+    "paragraph": "Datenvorbereitung"
    },
    "source": [
     "ZunÃ¤chst wird der Typ der Daten nach dem Einlesen in das Notebook Ã¼berprÃ¼ft. Einlesefehler werden entsprechend korrigiert. Danach werden die einzelnen Kundenmerkmale einer deskriptiven Analyse unterzogen. Damit lÃ¤sst sich der Zusammenhang zur Zielvariable Kundenabwanderung visuell darstellen. Auf der Grundlage einer Korrelationsanalyse werden die ZusammenhÃ¤nge zwischen Kundenmerkmalen und der Zielvariable untersucht. Kundenmerkmale die keinen Mehrwert bieten werden entfernt (= Dimensionsreduktion). Die Ausgewogenheit des Datensatzes in Bezug auf die Zielvariable wird grafisch dargestellt. Die Kunden mit Abwanderung machen etwa 27 % des gesamten Datensatzes aus, wÃ¤hrend loyale Kunden etwa 73% ausmachen. Daher liegt ein unausgewogener Datensatz vor. AnschlieÃŸend werden die kategorialen Werte umgewandelt (= Bildung von Dummy Variablen). Die einzelnen Kundenmerkmale werden auf MultikollinearitÃ¤t und statistische Signifikanz geprÃ¼ft. SchlieÃŸlich werden alle Kundenmerkmale auf ein gemeinsames Messniveau gebracht (= Standardisierung). Durch ein Undersampling wird die Unausgewogenheit des Datensatzes ausgeglichen. AbschlieÃŸend werden Trainings- und Testdaten gebildet."
-- 
GitLab