KI_LAB
machine-learning-services

Repository



Classification of clothing through images

see German Version below


Business Understanding
Corporation: na

Industry: Fashion

Area of Application: Logistics

Business Objective: Identification of clothing through images.

Description: Returned items must be able to be restocked and sold. For this purpose, the goods must be identified and labeled. An ML service is to be used to support this process.

Solution: Manual recognition by humans and manual labeling of clothing.

Data Understanding
Data Frame: fashion-mnist_test

Source: Kaggle, https://github.com/zalandoresearch/fashion-mnist

Data Creator: Zalando

Date of Publication: 2017

Data Type: CSV

Description of Data Frame: The dataset consists of item images from the Zalando company. In total 60,000 training images and 10,000 test images are included, which were scaled to 28x28 pixels and converted to a grayscale image.

Number of Features: 28x28 pixel + label

Number of Targets: 1

Data Type per Feature: Integer

Data Type per Target: Integer

Number of Observations: 70.000

Location parameter: na

Distribution parameter: na

Correlation Analysis: na

Data Preparation
Dimensionality Reduction:

Outlier:

Missing Data:

Unbalanced Data:

Data Conversion: Scaling to grayscale color with a value between 0-1, convert the image shape from 784 to 28x28 (only if loaded as CSV with 784 columns), Convert the labels to categorial data (10 Categories)

Distribution Function: na
Feature Scaling:

Multicollinearity:

Modelling and Evaluation
Algorithms:  Convolutional Neural Network (CNN)

Hyperparameter: The first and second convolutional layer is parameterized with 32 filters and a kernel size of 3 and no padding

Output: supervised learning, classification

Activation Function: A ReLu (Rectified Linear Unit) is used as the activation function. A softmax function is used as the activation function for the output.

Data Split: 60.000 samples as train data, 10.000 samples as test data

Model Description: Initially, some adjustments were made to ensure that some criteria for the model were met. 10% of the training data is used for validation. The architecture or model of the CNN is based on the LeNet-5 architecture. However, the model has been modified in some places. A maximum pooling layer was removed and a dropout layer was added. At the end the model consists of two Convolutional Layer, afterwards follows a maximum pooling layer. After the pooling layer follows a data-Preparation layer follows to convert the matrices to a one-dimensional array so that they can be processed by the two Fully-Connected layers. In addition, a Dropout layer was added to counteract overfitting by randomly discarding 40% of the data per iteration.
Evaluation Metrics: Accuracy=93,24%, Error=21%
Additional Information:

Deployment
Service:
Target Group: Online stores, fashion stores, logistics

Benefits: Cost savings, time savings, automation of processes.

Integration:


Classification of clothing through images (Deutschsprachige Version)

Geschäftsverständnis
Unternehmen: na

Branche: Mode

Anwendungsbereich: Logistik

Geschäftsziel: Identifikation von Kleidung durch Bilder.

Beschreibung: Retouren müssen wieder aufgefüllt und verkauft werden können. Zu diesem Zweck müssen die Waren identifiziert und etikettiert werden. Zur Unterstützung dieses Prozesses soll ein ML-Dienst eingesetzt werden.

Lösung: Manuelle Erkennung durch Menschen und manuelle Beschriftung der Kleidung.

Datenverständnis
Datenrahmen: fashion-mnist_test

Quelle: Kaggle, https://github.com/zalandoresearch/fashion-mnist

Datenersteller: Zalando

Datum der Veröffentlichung: 2017

Datentyp: CSV

Beschreibung des Datenrahmens: Der Datensatz besteht aus Artikelbildern der Firma Zalando. Insgesamt sind 60.000 Trainingsbilder und 10.000 Testbilder enthalten, die auf 28x28 Pixel skaliert und in ein Graustufenbild umgewandelt wurden.

Anzahl der Merkmale: 28x28 Pixel + Label

Anzahl der Ziele: 1

Datentyp pro Merkmal: integer

Datentyp pro Ziel: integer

Anzahl der Beobachtungen: 70.000

Parameter "Standort": na

Verteilungsparameter: na

Korrelationsanalyse: na

Datenaufbereitung
Dimensionalitätsreduktion: na

Ausreißer:

Fehlende Daten:

Unausgewogene Daten:

Datenkonvertierung: Skalierung in Graustufenfarbe mit einem Wert zwischen 0-1, Konvertierung der Bildform von 784 in 28x28 (nur wenn als CSV mit 784 Spalten geladen), Konvertierung der Etiketten in kategoriale Daten (10 Kategorien)

Verteilungsfunktion: na

Merkmal Skalierung:

Multikollinearität:

Modellierung und Auswertung
Algorithmen: Faltungsneuronales Netz (CNN)

Hyperparameter: Die erste und zweite Faltungsschicht ist mit 32 Filtern und einer Kernelgröße von 3 und keinem Padding parametrisiert

Output: überwachtes Lernen, Klassifikation

Aktivierungsfunktion: Als Aktivierungsfunktion wird eine ReLu (Rectified Linear Unit) verwendet. Eine Softmax-Funktion wird als Aktivierungsfunktion für die Ausgabe verwendet.

Datenaufteilung: 60.000 Proben als Trainingsdaten, 10.000 Proben als Testdaten

Beschreibung des Modells: Zu Beginn wurden einige Anpassungen vorgenommen, um sicherzustellen, dass einige Kriterien für das Modell erfüllt werden. 10 % der Trainingsdaten werden für die Validierung verwendet. Die Architektur oder das Modell des CNN basiert auf der LeNet-5-Architektur. Allerdings wurde das Modell an einigen Stellen modifiziert. Eine Maximum-Pooling-Schicht wurde entfernt und eine Dropout-Schicht wurde hinzugefügt. Am Ende besteht das Modell aus zwei Convolutional Layer, danach folgt ein Maximum Pooling Layer. Nach der Pooling-Schicht folgt eine Data-Preparation-Schicht, um die Matrizen in ein eindimensionales Array umzuwandeln, damit sie von den beiden Fully-Connected-Schichten verarbeitet werden können. Zusätzlich wurde eine Dropout-Schicht hinzugefügt, um einer Überanpassung entgegenzuwirken, indem 40% der Daten pro Iteration zufällig verworfen werden.
Auswertungsmetriken: Genauigkeit=93,24%, Fehler=21%
Zusätzliche Informationen:

Einsatz
Dienst:
Zielgruppe: Online-Shops, Modegeschäfte, Logistik

Vorteile: Kosteneinsparungen, Zeitersparnis, Automatisierung von Prozessen.

Integration: