From 8710f8b9599414ba093da958aed4702000461e24 Mon Sep 17 00:00:00 2001 From: Andi Buzer <78602630+AndiBuzer@users.noreply.github.com> Date: Sat, 1 Jun 2024 17:55:15 +0200 Subject: [PATCH] small tagging fixes --- CRM/Customer Churn Prediction/notebook.ipynb | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/CRM/Customer Churn Prediction/notebook.ipynb b/CRM/Customer Churn Prediction/notebook.ipynb index b7f57c3..aec7bc3 100644 --- a/CRM/Customer Churn Prediction/notebook.ipynb +++ b/CRM/Customer Churn Prediction/notebook.ipynb @@ -59,7 +59,7 @@ "cell_type": "markdown", "metadata": { "include": true, - "paragraph": "Datenvorbereitung​" + "paragraph": "Datenvorbereitung" }, "source": [ "Zunächst wird der Typ der Daten nach dem Einlesen in das Notebook überprüft. Einlesefehler werden entsprechend korrigiert. Danach werden die einzelnen Kundenmerkmale einer deskriptiven Analyse unterzogen. Damit lässt sich der Zusammenhang zur Zielvariable Kundenabwanderung visuell darstellen. Auf der Grundlage einer Korrelationsanalyse werden die Zusammenhänge zwischen Kundenmerkmalen und der Zielvariable untersucht. Kundenmerkmale die keinen Mehrwert bieten werden entfernt (= Dimensionsreduktion). Die Ausgewogenheit des Datensatzes in Bezug auf die Zielvariable wird grafisch dargestellt. Die Kunden mit Abwanderung machen etwa 27 % des gesamten Datensatzes aus, während loyale Kunden etwa 73% ausmachen. Daher liegt ein unausgewogener Datensatz vor. Anschließend werden die kategorialen Werte umgewandelt (= Bildung von Dummy Variablen). Die einzelnen Kundenmerkmale werden auf Multikollinearität und statistische Signifikanz geprüft. Schließlich werden alle Kundenmerkmale auf ein gemeinsames Messniveau gebracht (= Standardisierung). Durch ein Undersampling wird die Unausgewogenheit des Datensatzes ausgeglichen. Abschließend werden Trainings- und Testdaten gebildet." -- GitLab