-
Nikolay Nikolaev authoredNikolay Nikolaev authored
- Datenbasis
- Datenherkunft
- Inhalt
- Hypothesen
- Datenaufbereitung
- Einlesen von Daten
- Inkonsistenzen und Leerstellen beheben
- Quiz
- Datenanalyse
- Mittelwert
- Median
- Varianz
- Standardabweichung
- Lineare Regression
- Hypothesentest
- Ergebnispräsentation
- Streudiagramm
- Kein Plan
- Teaminfos
- Nikolay Nikolaev
- Maximilian Fronmüller
- Lino Cortese
title: "Data Science Tutorial"
output: learnr::tutorial
runtime: shiny_prerendered
library(learnr)
library(readxl)
knitr::opts_chunk$set(echo = FALSE)
Datenbasis
Datenherkunft
In diesem Praktikum verwenden wir das Dataset "Board Games Analysis
Link zum Notebook auf Kaggle: https://www.kaggle.com/code/karnikakapoor/board-games-analysis
Link zum Datensatz: https://www.kaggle.com/code/karnikakapoor/board-games-analysis/input
Inhalt
Der Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Hier sind die Spalten und ihre jeweiligen Inhalte:
ID: Eine eindeutige Identifikationsnummer für jedes Brettspiel im Datensatz.(Integer)
Name: Der Name des Brettspiels.(String)
Year: Das Jahr, in dem das Brettspiel veröffentlicht wurde.(Integer)
Published: Informationen über die Veröffentlichung des Spiels.(Integer)
Min Players: Die minimale Anzahl von Spielern, die das Spiel spielen können.(Integer)
Max Players: Die maximale Anzahl von Spielern, die das Spiel unterstützt.(Integer)
Play Time: Die durchschnittliche Spielzeit des Brettspiels.(Integer)
Min Age: Die empfohlene minimale Altersgruppe für Spieler des Spiels.(Integer)
Users Rated: Die Anzahl der Benutzer, die das Spiel bewertet haben.(Double)
Rating Average: Der durchschnittliche Bewertungswert des Spiels durch Benutzer.(Double)
BGG Rank: Die Rangposition des Spiels auf BoardGameGeek.(Integer)
Complexity Average: Der durchschnittliche Schwierigkeitsgrad des Spiels.(Double)
Owned Users: Die Anzahl der Benutzer, die das Spiel besitzen.(Integer)
Mechanics: Informationen über die Spielmechanismen, die im Brettspiel verwendet werden.(String)
Domains: Die Domänen oder Kategorien, zu denen das Brettspiel gehört.(String)\
Diese Spalten bieten eine breite Palette von Informationen über die charakteristischen Merkmale, Bewertungen und Eigenschaften der aufgeführten Brettspiele im Datensatz. Die Daten können für Analysen und Erkenntnisse im Bereich der Brettspielindustrie sowie für die Beurteilung von Präferenzen und Trends unter den Spielern verwendet werden.
Hypothesen
Wir formulieren zwei Hypothesen, die wir im "Datenanalyse"-Abschnitt testen werden.
Hypothese 1: Spiele mit höheren Complexity Score haben niedriger anzahl von Owned Users.
Hypothese 2: Spiele mit höheren Complexity Score haben höhere Play Time.
Datenaufbereitung
Einlesen von Daten
Here's an exercise where the chunk is pre-evaluated via the exercise.eval
option (so the user can see the default output we'd like them to customize). We also add a "hint" to the correct solution via the chunk immediate below labeled print-limit-hint
.
Modify the following code to limit the number of rows printed to 5:
mtcars
head(mtcars)
Inkonsistenzen und Leerstellen beheben
Here's an exercise where the chunk is pre-evaluated via the exercise.eval
option (so the user can see the default output we'd like them to customize). We also add a "hint" to the correct solution via the chunk immediate below labeled print-limit-hint
.
Modify the following code to limit the number of rows printed to 5:
Quiz
You can include any number of single or multiple choice questions as a quiz. Use the question
function to define a question and the quiz
function for grouping multiple questions together.
Some questions to verify that you understand the purposes of various base and recommended R packages:
quiz(
question("Which package contains functions for installing other R packages?",
answer("base"),
answer("tools"),
answer("utils", correct = TRUE),
answer("codetools")
),
question("Which of the R packages listed below are used to create plots?",
answer("lattice", correct = TRUE),
answer("tools"),
answer("stats"),
answer("grid", correct = TRUE)
)
)