From f96df9cbccbb959e04e9fa822e270297375ab268 Mon Sep 17 00:00:00 2001
From: Patrick Schnepf <patrickschnepf@MacBook-Air-von-Patrick.fritz.box>
Date: Wed, 3 Jul 2024 20:48:36 +0200
Subject: [PATCH] Notebook Tags nach oben geschoben

---
 .../notebook.ipynb                            | 236 +++++++++---------
 1 file changed, 118 insertions(+), 118 deletions(-)

diff --git a/Warehouse/Classification of clothing through images/notebook.ipynb b/Warehouse/Classification of clothing through images/notebook.ipynb
index adeb166..732734c 100644
--- a/Warehouse/Classification of clothing through images/notebook.ipynb	
+++ b/Warehouse/Classification of clothing through images/notebook.ipynb	
@@ -72,6 +72,124 @@
     "Der Fashion-MNIST-Datensatz bietet eine moderne und herausfordernde Alternative zum klassischen MNIST-Datensatz, da er realistischere und komplexere Bilder von KleidungsstÃ¼cken enthÃ¤lt. Dies stellt eine grÃ¶ÃŸere Herausforderung fÃ¼r Bildklassifizierungsmodelle dar und bietet eine realistischere AnwendungsmÃ¶glichkeit im Bereich der maschinellen Bildverarbeitung."
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": []
+   },
+   "source": [
+    "## 3. Datenvorbereitung"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "include": true,
+    "paragraph": "Datenvorbereitung",
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": []
+   },
+   "source": [
+    "Die Data Preparation Phase beginnt mit der Aufteilung der Daten in Trainings-, Validierungs- und Testsets sowie der Skalierung der Merkmale. AnschlieÃŸend werden die Bildformate von 784 auf 28x28 umgewandelt (falls als CSV mit 784 Spalten geladen) und die Labels in ein kategorisches Format konvertiert. Die ÃœberprÃ¼fung der Datenformate gewÃ¤hrleistet, dass alle Daten im korrekten Format vorliegen."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": []
+   },
+   "source": [
+    "# 4. Datenmodell"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "include": true,
+    "paragraph": "Datenmodell",
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": [
+     "datenmodell"
+    ]
+   },
+   "source": [
+    "In der Modellierungsphase wird die Architektur des Modells definiert, die verschiedene Arten von Schichten umfasst. ZunÃ¤chst wurde ein einfaches DNN mit dichten Schichten ausprobiert, jedoch konnten verbesserte Ergebnisse erzielt werden, indem auf eine CNN-Architektur umgestellt wurde. Als Ausgangsarchitektur wurde die Implementierung von LeNet-5 gewÃ¤hlt und angepasst. Die Hyperparameter wurden mithilfe eines Keras-Optimierers optimiert, der verschiedene Kombinationen ausprobierte, um die aktuellen Parameter auszuwÃ¤hlen. Das Modell umfasst Schichten wie Dense fÃ¼r die Berechnung des Skalarprodukts, Dropout zur Vermeidung von Ãœberanpassung, Flatten zum Flachlegen von Matrizen, MaxPooling2D zur Reduzierung der Eingabedimensionen und Conv2D fÃ¼r Faltungsoperationen auf den Eingabedaten."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": []
+   },
+   "source": [
+    "## 5. Evaluation"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "include": true,
+    "paragraph": "Evaluation",
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": [
+     "evaluation"
+    ]
+   },
+   "source": [
+    "Nach dem Training und der Validierung des Modells wird die Leistung anhand der Testdaten ausgewertet. Dabei erreicht das Modell eine Testgenauigkeit von Ã¼ber 90 %, was darauf hinweist, dass es gut in der Lage ist, neue, bisher ungesehene Daten zu klassifizieren. Der Testverlust ist ebenfalls akzeptabel niedrig, was darauf hinweist, dass das Modell Vorhersagen nahe an den tatsÃ¤chlichen Daten trifft. ZusÃ¤tzlich zeigen klassenspezifische Metriken wie PrÃ¤zision, RÃ¼ckruf und F1-Score fÃ¼r jede Klasse (z.B. Top, Trouser, Pullover usw.), dass das Modell gute bis sehr gute Ergebnisse erzielt, insbesondere bei Klassen wie Sneaker, Bag und Ankle boot. Diese Ergebnisse bieten eine umfassende Bewertung der Modellleistung und helfen dabei, seine Eignung fÃ¼r praktische Anwendungen zu beurteilen."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": []
+   },
+   "source": [
+    "## 6. Umsetzung"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {
+    "editable": true,
+    "include": true,
+    "paragraph": "Umsetzung",
+    "slideshow": {
+     "slide_type": ""
+    },
+    "tags": [
+     "umsetzung"
+    ]
+   },
+   "source": [
+    "Im Rahmen des CRISP-DM Zyklus stellt das Deployment den letzten Schritt dar, bei dem das trainierte Modell fÃ¼r den produktiven Einsatz vorbereitet wird. Dies beinhaltet die Implementierung des Modells in eine Produktionsumgebung, wo es Echtzeitdaten verarbeiten kann. Vor dem Deployment mÃ¼ssen alle Aspekte wie Modellperformance auf Testdaten, Sicherstellung der Skalierbarkeit und Integration in bestehende Systeme sorgfÃ¤ltig Ã¼berprÃ¼ft werden. Zudem ist es entscheidend, fortlaufende Ãœberwachung und Wartung sicherzustellen, um die langfristige Leistung und Genauigkeit des Modells zu gewÃ¤hrleisten."
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -1323,34 +1441,6 @@
     "plt.show()"
    ]
   },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": []
-   },
-   "source": [
-    "## 3. Datenvorbereitung"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "include": true,
-    "paragraph": "Datenvorbereitung",
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": []
-   },
-   "source": [
-    "Die Data Preparation Phase beginnt mit der Aufteilung der Daten in Trainings-, Validierungs- und Testsets sowie der Skalierung der Merkmale. AnschlieÃŸend werden die Bildformate von 784 auf 28x28 umgewandelt (falls als CSV mit 784 Spalten geladen) und die Labels in ein kategorisches Format konvertiert. Die ÃœberprÃ¼fung der Datenformate gewÃ¤hrleistet, dass alle Daten im korrekten Format vorliegen."
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -1468,36 +1558,6 @@
     "print(y_test.shape)\n"
    ]
   },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": []
-   },
-   "source": [
-    "# 4. Datenmodell"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "include": true,
-    "paragraph": "Datenmodell",
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": [
-     "datenmodell"
-    ]
-   },
-   "source": [
-    "In der Modellierungsphase wird die Architektur des Modells definiert, die verschiedene Arten von Schichten umfasst. ZunÃ¤chst wurde ein einfaches DNN mit dichten Schichten ausprobiert, jedoch konnten verbesserte Ergebnisse erzielt werden, indem auf eine CNN-Architektur umgestellt wurde. Als Ausgangsarchitektur wurde die Implementierung von LeNet-5 gewÃ¤hlt und angepasst. Die Hyperparameter wurden mithilfe eines Keras-Optimierers optimiert, der verschiedene Kombinationen ausprobierte, um die aktuellen Parameter auszuwÃ¤hlen. Das Modell umfasst Schichten wie Dense fÃ¼r die Berechnung des Skalarprodukts, Dropout zur Vermeidung von Ãœberanpassung, Flatten zum Flachlegen von Matrizen, MaxPooling2D zur Reduzierung der Eingabedimensionen und Conv2D fÃ¼r Faltungsoperationen auf den Eingabedaten."
-   ]
-  },
   {
    "cell_type": "code",
    "execution_count": 19,
@@ -1874,66 +1934,6 @@
    "source": [
     "print(classification_report(y_test, predicted_classes, target_names=class_names))"
    ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": []
-   },
-   "source": [
-    "## 5. Evaluation"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "include": true,
-    "paragraph": "Evaluation",
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": [
-     "evaluation"
-    ]
-   },
-   "source": [
-    "Nach dem Training und der Validierung des Modells wird die Leistung anhand der Testdaten ausgewertet. Dabei erreicht das Modell eine Testgenauigkeit von Ã¼ber 90 %, was darauf hinweist, dass es gut in der Lage ist, neue, bisher ungesehene Daten zu klassifizieren. Der Testverlust ist ebenfalls akzeptabel niedrig, was darauf hinweist, dass das Modell Vorhersagen nahe an den tatsÃ¤chlichen Daten trifft. ZusÃ¤tzlich zeigen klassenspezifische Metriken wie PrÃ¤zision, RÃ¼ckruf und F1-Score fÃ¼r jede Klasse (z.B. Top, Trouser, Pullover usw.), dass das Modell gute bis sehr gute Ergebnisse erzielt, insbesondere bei Klassen wie Sneaker, Bag und Ankle boot. Diese Ergebnisse bieten eine umfassende Bewertung der Modellleistung und helfen dabei, seine Eignung fÃ¼r praktische Anwendungen zu beurteilen."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": []
-   },
-   "source": [
-    "## 6. Umsetzung"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "editable": true,
-    "include": true,
-    "paragraph": "Umsetzung",
-    "slideshow": {
-     "slide_type": ""
-    },
-    "tags": [
-     "umsetzung"
-    ]
-   },
-   "source": [
-    "Im Rahmen des CRISP-DM Zyklus stellt das Deployment den letzten Schritt dar, bei dem das trainierte Modell fÃ¼r den produktiven Einsatz vorbereitet wird. Dies beinhaltet die Implementierung des Modells in eine Produktionsumgebung, wo es Echtzeitdaten verarbeiten kann. Vor dem Deployment mÃ¼ssen alle Aspekte wie Modellperformance auf Testdaten, Sicherstellung der Skalierbarkeit und Integration in bestehende Systeme sorgfÃ¤ltig Ã¼berprÃ¼ft werden. Zudem ist es entscheidend, fortlaufende Ãœberwachung und Wartung sicherzustellen, um die langfristige Leistung und Genauigkeit des Modells zu gewÃ¤hrleisten."
-   ]
   }
  ],
  "metadata": {
-- 
GitLab