Skip to content
Snippets Groups Projects
Code owners
Assign users and groups as approvers for specific file changes. Learn more.
title: "Data Science Tutorial"
output: learnr::tutorial
runtime: shiny_prerendered
library(learnr)
library(readxl)
knitr::opts_chunk$set(echo = FALSE)

Datenbasis

Datenherkunft

In diesem Praktikum verwenden wir das Dataset "Board Games Analysis :game_die::game_die::dart:". Die Daten wurden ursprünglich aus der BoardGameGeek-Datenbank extrahiert und anschließend auf Kaggle hochgeladen, wo sie zu einem Datensatz zusammengeführt wurden.

Link zum Notebook auf Kaggle: https://www.kaggle.com/code/karnikakapoor/board-games-analysis
Link zum Datensatz: https://www.kaggle.com/code/karnikakapoor/board-games-analysis/input

Inhalt

Der Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Hier sind die Spalten und ihre jeweiligen Inhalte:

ID: Eine eindeutige Identifikationsnummer für jedes Brettspiel im Datensatz.(Integer)
Name: Der Name des Brettspiels.(String)
Year: Das Jahr, in dem das Brettspiel veröffentlicht wurde.(Integer)
Published: Informationen über die Veröffentlichung des Spiels.(Integer)
Min Players: Die minimale Anzahl von Spielern, die das Spiel spielen können.(Integer)
Max Players: Die maximale Anzahl von Spielern, die das Spiel unterstützt.(Integer)
Play Time: Die durchschnittliche Spielzeit des Brettspiels.(Integer)
Min Age: Die empfohlene minimale Altersgruppe für Spieler des Spiels.(Integer)
Users Rated: Die Anzahl der Benutzer, die das Spiel bewertet haben.(Double)
Rating Average: Der durchschnittliche Bewertungswert des Spiels durch Benutzer.(Double)
BGG Rank: Die Rangposition des Spiels auf BoardGameGeek.(Integer)
Complexity Average: Der durchschnittliche Schwierigkeitsgrad des Spiels.(Double)
Owned Users: Die Anzahl der Benutzer, die das Spiel besitzen.(Integer)
Mechanics: Informationen über die Spielmechanismen, die im Brettspiel verwendet werden.(String)
Domains: Die Domänen oder Kategorien, zu denen das Brettspiel gehört.(String)\

Diese Spalten bieten eine breite Palette von Informationen über die charakteristischen Merkmale, Bewertungen und Eigenschaften der aufgeführten Brettspiele im Datensatz. Die Daten können für Analysen und Erkenntnisse im Bereich der Brettspielindustrie sowie für die Beurteilung von Präferenzen und Trends unter den Spielern verwendet werden.

Hypothesen

Wir formulieren zwei Hypothesen, die wir im "Datenanalyse"-Abschnitt testen werden.

Hypothese 1: Spiele mit höheren Complexity Score haben niedriger anzahl von Owned Users.

Hypothese 2: Spiele mit höheren Complexity Score haben höhere Play Time.

Datenaufbereitung

Einlesen von Daten

Here's an exercise where the chunk is pre-evaluated via the exercise.eval option (so the user can see the default output we'd like them to customize). We also add a "hint" to the correct solution via the chunk immediate below labeled print-limit-hint.

Modify the following code to limit the number of rows printed to 5:

mtcars
head(mtcars)

Inkonsistenzen und Leerstellen beheben

Here's an exercise where the chunk is pre-evaluated via the exercise.eval option (so the user can see the default output we'd like them to customize). We also add a "hint" to the correct solution via the chunk immediate below labeled print-limit-hint.

Modify the following code to limit the number of rows printed to 5:

Quiz

You can include any number of single or multiple choice questions as a quiz. Use the question function to define a question and the quiz function for grouping multiple questions together.

Some questions to verify that you understand the purposes of various base and recommended R packages:

quiz(
  question("Which package contains functions for installing other R packages?",
    answer("base"),
    answer("tools"),
    answer("utils", correct = TRUE),
    answer("codetools")
  ),
  question("Which of the R packages listed below are used to create plots?",
    answer("lattice", correct = TRUE),
    answer("tools"),
    answer("stats"),
    answer("grid", correct = TRUE)
  )
)

Datenanalyse

Mittelwert

Median

Varianz

Standardabweichung

Lineare Regression

Hypothesentest

Ergebnispräsentation

Streudiagramm

Kein Plan

Teaminfos

Nikolay Nikolaev

Maximilian Fronmüller

Lino Cortese