Skip to content
Snippets Groups Projects
Select Git revision
  • 4b812a2241b3d1ba69c221e26aebcd37932ae97f
  • main default protected
  • improvement_risk_prediction_of_heart_disease
  • improvement_increase_customer_satisfaction
  • improvement_predicting_mental_illness_for_health_insurance
  • improvement_predicting_Hotelcancellation
  • improvement_free_ranging2
  • improvement_Forecast_Of_Required_Vehicles_In_the_City
  • improvement_Predicting_mental_illness
  • bugfix_SuccessPrediction_Startups
  • improvement_make_einheitlich
  • bugfix_Maintenance_IOTsystems
  • improvement_Tags_nach_oben_Hannes
  • improvement_onlineretail2
  • improvement_free_ranging_cattle
  • improvement_onlineretail
  • improvement_sentiment_fluggeselschaft
  • improvement_Forecast_Of_Required_Vehicles_City_Center
  • improvement_mark_spot
  • improvement_Predicting_mental_illness_for_health_insurance
  • improvement_Analysis_of_the_movement_and_activity_of_free-ranging_cattle
21 results

README.md

Blame
  • user avatar
    eebalaban authored and GitHub committed
    4b812a22
    History
    Code owners
    Assign users and groups as approvers for specific file changes. Learn more.

    English Version

    Open Notebook In Google Colab

    Business Understanding

    Corporation: Spotify
    Industry: music
    Area of application: Algorithms
    Description: The Spotify company wants to use AI to pursue key potentials and challenges to create a unique and personalized playlist for every user a unique and personalized playlist. Machine learning and algorithms are used for this purpose, which adapts to individual users.

    Data Understanding

    Data Frame: popularity
    Source: https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks
    Data Creator: Spotify
    Date of Publication: 2020
    Data Type: CSV
    Description of Data Frame: The dataset consists of different song properties, such as component, release year and many more.
    Number of features: 19
    number of targets: 1
    Data type per feature: integer

    Data Preparation

    Dimensionality Reduction: Attributes that do not add value or are not significant are removed
    Outlier:
    Missing Data:
    Unbalanced Data:
    Data Conversion: Coding the categorical features
    Distribution Function: StandardScaler

    Modelling and Evaluation

    Algorithms: Lineare Degression
    Hyperparameter:
    Output: supervised learning, classification
    Data Split: 80% train data, 20% test data
    Evaluation Metrics: train performance: 0.42002501021526495; test performance: 0.4207911441145905

    Deployment

    Service: Generation of an individual list
    Target Group: spotify users
    Benefits: Through this service, an individual, specific playlist can be created for each Spotify user, which helps to retain customers
    Integration:

    German Version

    Geschäftsverständnis

    Konzern: Spotify
    Industrie: Musik
    Anwendungsbereich: Generierung einer Musikplaylist
    Beschreibung: Das Unternehmen Spotify möchte mit dem Einsatz von KI wichtige Potenziale und Herausforderungen nachgehen, um für jeden Benutzer eine einzigartige und personalisierte Wiedergabeliste zu erstellen. Hierbei werden maschinelles Lernen und Algorithmen eingesetzt, welche sich an individuelle Nutzer anpasst.
    Lösung: na

    Datenverständnis

    Datenrahmen: Popularität
    Quelle: https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks
    Datenersteller: Spotify
    Veröffentlichungsdatum: 2020
    Datentyp: CSV
    Beschreibung des Datenrahmens: Der Datensatz besteht aus unterschiedlichen Songeigenschaften, wie Komponent, Erscheinungsjahr und viele weitere.
    Anzahl der Attribute: 19
    Anzahl der Zielvariablen: 1
    Datentyp pro Attribut:
    Datentyp pro Zielvariable: integer

    Standortparameter:
    Verteilungsparameter:
    Korrelationsanalyse:

    Datenaufbereitung

    Dimensionsreduktion: Attribute, die keinen Mehrwert bieten oder nicht signifikant sind, werden entfernt.
    Ausreißer:
    Fehlende Daten:
    Unausgeglichene Daten:
    Datenkonvertierung: Kodierung der kategorialen Merkmale.
    Verteilungsfunktion: StandardScaler
    Funktionsskalierung:
    Multikollinearität:

    Modellierung und Auswertung

    Algorithmen: Lineare Degression
    Hyperparameter:
    Ausgabe: supervised learning, classification
    Datenaufteilung: 80% Trainingsdaten, 20% Testdaten
    Bewertungsmetriken: Trainingsperformance: 0.42002501021526495; Testperformance: 0.4207911441145905
    Weitere Informationen:

    Bereitstellung

    Service: Generierung einer individuellen Liste
    Zielgruppe: Spotify Nutzer
    Leistungen: Durch diesen Service kann für jeden Spotify Nutzer eine individuelle, spezifische Wiedergabeliste erstellt werden, wodurch die Kunden gebunden werden können
    Integration: