From 8710f8b9599414ba093da958aed4702000461e24 Mon Sep 17 00:00:00 2001
From: Andi Buzer <78602630+AndiBuzer@users.noreply.github.com>
Date: Sat, 1 Jun 2024 17:55:15 +0200
Subject: [PATCH] small tagging fixes

---
 CRM/Customer Churn Prediction/notebook.ipynb | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/CRM/Customer Churn Prediction/notebook.ipynb b/CRM/Customer Churn Prediction/notebook.ipynb
index b7f57c3..aec7bc3 100644
--- a/CRM/Customer Churn Prediction/notebook.ipynb	
+++ b/CRM/Customer Churn Prediction/notebook.ipynb	
@@ -59,7 +59,7 @@
    "cell_type": "markdown",
    "metadata": {
     "include": true,
-    "paragraph": "Datenvorbereitungâ€‹"
+    "paragraph": "Datenvorbereitung"
    },
    "source": [
     "ZunÃ¤chst wird der Typ der Daten nach dem Einlesen in das Notebook Ã¼berprÃ¼ft. Einlesefehler werden entsprechend korrigiert. Danach werden die einzelnen Kundenmerkmale einer deskriptiven Analyse unterzogen. Damit lÃ¤sst sich der Zusammenhang zur Zielvariable Kundenabwanderung visuell darstellen. Auf der Grundlage einer Korrelationsanalyse werden die ZusammenhÃ¤nge zwischen Kundenmerkmalen und der Zielvariable untersucht. Kundenmerkmale die keinen Mehrwert bieten werden entfernt (= Dimensionsreduktion). Die Ausgewogenheit des Datensatzes in Bezug auf die Zielvariable wird grafisch dargestellt. Die Kunden mit Abwanderung machen etwa 27 % des gesamten Datensatzes aus, wÃ¤hrend loyale Kunden etwa 73% ausmachen. Daher liegt ein unausgewogener Datensatz vor. AnschlieÃŸend werden die kategorialen Werte umgewandelt (= Bildung von Dummy Variablen). Die einzelnen Kundenmerkmale werden auf MultikollinearitÃ¤t und statistische Signifikanz geprÃ¼ft. SchlieÃŸlich werden alle Kundenmerkmale auf ein gemeinsames Messniveau gebracht (= Standardisierung). Durch ein Undersampling wird die Unausgewogenheit des Datensatzes ausgeglichen. AbschlieÃŸend werden Trainings- und Testdaten gebildet."
-- 
GitLab