Skip to content
Snippets Groups Projects
Forked from Elias Waschin-Scholvin / DBE_Hackathon_
Source project has a limited visibility.
Code owners
Assign users and groups as approvers for specific file changes. Learn more.

English Version

Open Notebook In Google Colab

Business Understanding

Corporation: Spotify
Industry: music
Area of application: Algorithms
Description: The Spotify company wants to use AI to pursue key potentials and challenges to create a unique and personalized playlist for every user a unique and personalized playlist. Machine learning and algorithms are used for this purpose, which adapts to individual users.

Data Understanding

Data Frame: popularity
Source: https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks
Data Creator: Spotify
Date of Publication: 2020
Data Type: CSV
Description of Data Frame: The dataset consists of different song properties, such as component, release year and many more.
Number of features: 19
number of targets: 1
Data type per feature: integer

Data Preparation

Dimensionality Reduction: Attributes that do not add value or are not significant are removed
Outlier:
Missing Data:
Unbalanced Data:
Data Conversion: Coding the categorical features
Distribution Function: StandardScaler

Modelling and Evaluation

Algorithms: Lineare Degression
Hyperparameter:
Output: supervised learning, classification
Data Split: 80% train data, 20% test data
Evaluation Metrics: train performance: 0.42002501021526495; test performance: 0.4207911441145905

Deployment

Service: Generation of an individual list
Target Group: spotify users
Benefits: Through this service, an individual, specific playlist can be created for each Spotify user, which helps to retain customers
Integration:

German Version

Geschäftsverständnis

Konzern: Spotify
Industrie: Musik
Anwendungsbereich: Generierung einer Musikplaylist
Beschreibung: Das Unternehmen Spotify möchte mit dem Einsatz von KI wichtige Potenziale und Herausforderungen nachgehen, um für jeden Benutzer eine einzigartige und personalisierte Wiedergabeliste zu erstellen. Hierbei werden maschinelles Lernen und Algorithmen eingesetzt, welche sich an individuelle Nutzer anpasst.
Lösung: na

Datenverständnis

Datenrahmen: Popularität
Quelle: https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks
Datenersteller: Spotify
Veröffentlichungsdatum: 2020
Datentyp: CSV
Beschreibung des Datenrahmens: Der Datensatz besteht aus unterschiedlichen Songeigenschaften, wie Komponent, Erscheinungsjahr und viele weitere.
Anzahl der Attribute: 19
Anzahl der Zielvariablen: 1
Datentyp pro Attribut:
Datentyp pro Zielvariable: integer

Standortparameter:
Verteilungsparameter:
Korrelationsanalyse:

Datenaufbereitung

Dimensionsreduktion: Attribute, die keinen Mehrwert bieten oder nicht signifikant sind, werden entfernt.
Ausreißer:
Fehlende Daten:
Unausgeglichene Daten:
Datenkonvertierung: Kodierung der kategorialen Merkmale.
Verteilungsfunktion: StandardScaler
Funktionsskalierung:
Multikollinearität:

Modellierung und Auswertung

Algorithmen: Lineare Degression
Hyperparameter:
Ausgabe: supervised learning, classification
Datenaufteilung: 80% Trainingsdaten, 20% Testdaten
Bewertungsmetriken: Trainingsperformance: 0.42002501021526495; Testperformance: 0.4207911441145905
Weitere Informationen:

Bereitstellung

Service: Generierung einer individuellen Liste
Zielgruppe: Spotify Nutzer
Leistungen: Durch diesen Service kann für jeden Spotify Nutzer eine individuelle, spezifische Wiedergabeliste erstellt werden, wodurch die Kunden gebunden werden können
Integration: