Classification of clothing through images
see German Version below
Business Understanding
Corporation: na
Industry: Fashion
Area of Application: Logistics
Business Objective: Identification of clothing through images.
Description: Returned items must be able to be restocked and sold. For this purpose, the goods must be identified and labeled. An ML service is to be used to support this process.
Solution: Manual recognition by humans and manual labeling of clothing.
Data Understanding
Data Frame: fashion-mnist_test
Source: Kaggle, https://github.com/zalandoresearch/fashion-mnist
Data Creator: Zalando
Date of Publication: 2017
Data Type: CSV
Description of Data Frame: The dataset consists of item images from the Zalando company. In total 60,000 training images and 10,000 test images are included, which were scaled to 28x28 pixels and converted to a grayscale image.
Number of Features: 28x28 pixel + label
Number of Targets: 1
Data Type per Feature: Integer
Data Type per Target: Integer
Number of Observations: 70.000
Location parameter: na
Distribution parameter: na
Correlation Analysis: na
Data Preparation
Dimensionality Reduction:
Outlier:
Missing Data:
Unbalanced Data:
Data Conversion: Scaling to grayscale color with a value between 0-1, convert the image shape from 784 to 28x28 (only if loaded as CSV with 784 columns), Convert the labels to categorial data (10 Categories)
Distribution Function: na
Feature Scaling:
Multicollinearity:
Modelling and Evaluation
Algorithms: Convolutional Neural Network (CNN)
Hyperparameter: The first and second convolutional layer is parameterized with 32 filters and a kernel size of 3 and no padding
Output: supervised learning, classification
Activation Function: A ReLu (Rectified Linear Unit) is used as the activation function. A softmax function is used as the activation function for the output.
Data Split: 60.000 samples as train data, 10.000 samples as test data
Model Description: Initially, some adjustments were made to ensure that some criteria for the model were met. 10% of the training data is used for validation. The architecture or model of the CNN is based on the LeNet-5 architecture. However, the model has been modified in some places. A maximum pooling layer was removed and a dropout layer was added. At the end the model consists of two Convolutional Layer, afterwards follows a maximum pooling layer. After the pooling layer follows a data-Preparation layer follows to convert the matrices to a one-dimensional array so that they can be processed by the two Fully-Connected layers. In addition, a Dropout layer was added to counteract overfitting by randomly discarding 40% of the data per iteration.
Evaluation Metrics: Accuracy=93,24%, Error=21%
Additional Information:
Deployment
Service:
Target Group: Online stores, fashion stores, logistics
Benefits: Cost savings, time savings, automation of processes.
Integration:
Classification of clothing through images (Deutschsprachige Version)
Geschäftsverständnis
Unternehmen: na
Branche: Mode
Anwendungsbereich: Logistik
Geschäftsziel: Identifikation von Kleidung durch Bilder.
Beschreibung: Retouren müssen wieder aufgefüllt und verkauft werden können. Zu diesem Zweck müssen die Waren identifiziert und etikettiert werden. Zur Unterstützung dieses Prozesses soll ein ML-Dienst eingesetzt werden.
Lösung: Manuelle Erkennung durch Menschen und manuelle Beschriftung der Kleidung.
Datenverständnis
Datenrahmen: fashion-mnist_test
Quelle: Kaggle, https://github.com/zalandoresearch/fashion-mnist
Datenersteller: Zalando
Datum der Veröffentlichung: 2017
Datentyp: CSV
Beschreibung des Datenrahmens: Der Datensatz besteht aus Artikelbildern der Firma Zalando. Insgesamt sind 60.000 Trainingsbilder und 10.000 Testbilder enthalten, die auf 28x28 Pixel skaliert und in ein Graustufenbild umgewandelt wurden.
Anzahl der Merkmale: 28x28 Pixel + Label
Anzahl der Ziele: 1
Datentyp pro Merkmal: integer
Datentyp pro Ziel: integer
Anzahl der Beobachtungen: 70.000
Parameter "Standort": na
Verteilungsparameter: na
Korrelationsanalyse: na
Datenaufbereitung
Dimensionalitätsreduktion: na
Ausreißer:
Fehlende Daten:
Unausgewogene Daten:
Datenkonvertierung: Skalierung in Graustufenfarbe mit einem Wert zwischen 0-1, Konvertierung der Bildform von 784 in 28x28 (nur wenn als CSV mit 784 Spalten geladen), Konvertierung der Etiketten in kategoriale Daten (10 Kategorien)
Verteilungsfunktion: na
Merkmal Skalierung:
Multikollinearität:
Modellierung und Auswertung
Algorithmen: Faltungsneuronales Netz (CNN)
Hyperparameter: Die erste und zweite Faltungsschicht ist mit 32 Filtern und einer Kernelgröße von 3 und keinem Padding parametrisiert
Output: überwachtes Lernen, Klassifikation
Aktivierungsfunktion: Als Aktivierungsfunktion wird eine ReLu (Rectified Linear Unit) verwendet. Eine Softmax-Funktion wird als Aktivierungsfunktion für die Ausgabe verwendet.
Datenaufteilung: 60.000 Proben als Trainingsdaten, 10.000 Proben als Testdaten
Beschreibung des Modells: Zu Beginn wurden einige Anpassungen vorgenommen, um sicherzustellen, dass einige Kriterien für das Modell erfüllt werden. 10 % der Trainingsdaten werden für die Validierung verwendet. Die Architektur oder das Modell des CNN basiert auf der LeNet-5-Architektur. Allerdings wurde das Modell an einigen Stellen modifiziert. Eine Maximum-Pooling-Schicht wurde entfernt und eine Dropout-Schicht wurde hinzugefügt. Am Ende besteht das Modell aus zwei Convolutional Layer, danach folgt ein Maximum Pooling Layer. Nach der Pooling-Schicht folgt eine Data-Preparation-Schicht, um die Matrizen in ein eindimensionales Array umzuwandeln, damit sie von den beiden Fully-Connected-Schichten verarbeitet werden können. Zusätzlich wurde eine Dropout-Schicht hinzugefügt, um einer Überanpassung entgegenzuwirken, indem 40% der Daten pro Iteration zufällig verworfen werden.
Auswertungsmetriken: Genauigkeit=93,24%, Fehler=21%
Zusätzliche Informationen:
Einsatz
Dienst:
Zielgruppe: Online-Shops, Modegeschäfte, Logistik
Vorteile: Kosteneinsparungen, Zeitersparnis, Automatisierung von Prozessen.
Integration: