Skip to content
Snippets Groups Projects
Commit dc26b8a8 authored by Maximilian Fronmüller's avatar Maximilian Fronmüller
Browse files

Merge branch 'nikobranch' of...

Merge branch 'nikobranch' of https://gitlab.reutlingen-university.de/cortese/tutoRial into nikobranch

# Conflicts:
#	tutorial_page.Rmd
#	tutorial_page.html
parents 5072db06 aaeba421
No related branches found
No related tags found
1 merge request!1Nikobranch
...@@ -25,7 +25,7 @@ Link zum Datensatz auf Kaggle: https://www.kaggle.com/code/karnikakapoor/board-g ...@@ -25,7 +25,7 @@ Link zum Datensatz auf Kaggle: https://www.kaggle.com/code/karnikakapoor/board-g
### Inhalt ### Inhalt
Der Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Aus Darstellungsgründen wurde der Datensatz allerdings auf 500 Einträge reduziert. Hier sind die Spalten und ihre jeweiligen Inhalte: Der Originale Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Allerdings wurde der Datensatz für diese Übung auf 500 Einträge gekürzt. Hier sind die Spalten und ihre jeweiligen Inhalte:
**ID**: Eine eindeutige Identifikationsnummer für jedes Brettspiel im Datensatz.*(Integer)*\ **ID**: Eine eindeutige Identifikationsnummer für jedes Brettspiel im Datensatz.*(Integer)*\
**Name:** Der Name des Brettspiels.*(String)*\ **Name:** Der Name des Brettspiels.*(String)*\
...@@ -217,9 +217,9 @@ quiz( ...@@ -217,9 +217,9 @@ quiz(
## Datenanalyse ## Datenanalyse
In diesem Teil wird beschrieben, wie man verschiedene Daten mit Funktionen ermitteln kann.\ In diesem Teil wird beschrieben, wie man verschiedene Daten mit Funktionen ermitteln kann.\
Hierfür sollte man sich die Daten erneut anschauen.\ Hierfuer sollte man sich die Daten erneut anschauen.\
Für diesen Teil ist es wichtig zu wissen, wie man auf eine Spalte zugreifen kann. Dies macht man in dem man die Variable in dem der Datensatz gespeichert ist (hier gameData) angibt und den Spaltennamen in entweder zwei eckigen Klammern oder hinter einem $ Zeichen definiert.\ Fuer diesen Teil ist es wichtig zu wissen, wie man auf eine Spalte zugreifen kann. Dies macht man in dem man die Variable in dem der Datensatz gespeichert ist (hier gameData) angibt und den Spaltennamen in entweder zwei eckigen Klammern oder hinter einem $ Zeichen definiert.\
Die Syntax wäre dann beispielsweise:\ Die Syntax waere dann beispielsweise:\
```data[["column"]])``` oder ```data$column```, bzw. ```data$"spaced column name"```\ ```data[["column"]])``` oder ```data$column```, bzw. ```data$"spaced column name"```\
\ \
Die Tabelle unten zeigt alle Daten aus dem Datensatz. Mit den Pfeilen in der oberen Reihe kann man die durch die Spalten schalten. Die Tabelle unten zeigt alle Daten aus dem Datensatz. Mit den Pfeilen in der oberen Reihe kann man die durch die Spalten schalten.
...@@ -230,10 +230,10 @@ head(gameData) ...@@ -230,10 +230,10 @@ head(gameData)
### Mittelwert ### Mittelwert
Der Mittelwert bestimmt den Durchschnitt aller gegebenen Werte. Die Rechnung dafür ist:\ Der Mittelwert bestimmt den Durchschnitt aller gegebenen Werte. Die Rechnung dafuer ist:\
$(x_{1} + x_{2} + \cdots + x_{n}) / x$\ $(x_{1} + x_{2} + \cdots + x_{n}) / x$\
\ \
Um den Mittelwert einer Spalte zu bestimmen, vewendet man die 'mean()' Funktion verwenden. In diese setzt man die Variable in der die Daten gespeichert sind (gameData) und gibt die gewünschte Spalte an.\ Um den Mittelwert einer Spalte zu bestimmen, vewendet man die 'mean()' Funktion verwenden. In diese setzt man die Variable in der die Daten gespeichert sind (gameData) und gibt die gewuenschte Spalte an.\
\ \
Bestimmen Sie den Mittelwert von "Play Time". Bestimmen Sie den Mittelwert von "Play Time".
```{r mean, exercise=TRUE} ```{r mean, exercise=TRUE}
...@@ -284,18 +284,18 @@ Sie sollten hier den Wert 77.91056 bekommen. ...@@ -284,18 +284,18 @@ Sie sollten hier den Wert 77.91056 bekommen.
### Lineare Regression ### Lineare Regression
Die Lineare Regression bestimmt das Verhältnis zwischen zwei Werten(-sets).\ Die Lineare Regression bestimmt das Verhaeltnis zwischen zwei Werten(-sets).\
\ \
Die Varianz wird durch die 'lm()' Funktion bestimmt Hier übergibt man Daten welche mit einem Tilde-Symbol (~) verbunden sind, also beispielsweise ```lm(x~y)```.\ Die Varianz wird durch die 'lm()' Funktion bestimmt Hier uebergibt man Daten welche mit einem Tilde-Symbol (~) verbunden sind, also beispielsweise ```lm(x~y)```.\
Bestimmen sie die Lineare Regression mit "Users Rated" im Verhältnis zu "Owned Users". Bestimmen sie die Lineare Regression mit "Users Rated" im Verhaeltnis zu "Owned Users".
```{r linear-regression, exercise=TRUE} ```{r linear-regression, exercise=TRUE}
raters <- gameData$"Users Rated" raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users" owned <- gameData$"Owned Users"
``` ```
Falls man etwas mehr Information will, kann man die Eingabe (oder die Variale in welche man dies gespeichert hat) noch in die ```summary()``` Funktion schreiben.\ Falls man etwas mehr information will, kann man die Eingabe (oder die Variale in welche man dies gespeichert hat) noch in die ```summary()``` Funktion schreiben.\
Weiterhin kann man dies auf ein Plot abbilden. Dazu verwendet man die ```plot()``` Funktion in welche man einen x und y Wert eingibt, zusammen mit Optionen wie das Plot aussehen soll. Mehr information dazu findet man [in der Dokumentation](https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/plot).\ Weiterhin kann man dies auf ein Plot abbilden. Dazu verwendet man die ```plot()``` Funktion in welche man einen x und y Wert eingibt, zusammen mit Optionen wie das Plot aussehen soll. Mehr information dazu findet man [in der Dokumentation](https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/plot).\
Mit ```abline()``` kann man die Regressionslinie der lm Funktion abbilden. Dazu wird die lm Funktion, oder die Variable in der diese gespeichert ist, an ```abline()``` übergeben.\ Mit ```abline()``` kann man die Regressionslinie der lm Funktion abbilden. Dazu wird die lm Funktion, oder die Variable in der diese gespeichert ist, an ```abline()``` uebergeben.\
```{r lm-plot-example} ```{r lm-plot-example}
raters <- gameData$"Users Rated" raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users" owned <- gameData$"Owned Users"
...@@ -318,7 +318,7 @@ plot(, , pch = 16, col = "blue") ...@@ -318,7 +318,7 @@ plot(, , pch = 16, col = "blue")
### Hypothesentest ### Hypothesentest
R hat Funktionen zum Testen von Hypothesen. Hier kann man nun den [T-Test](https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/t.test) anwenden. In der Funktion ```t.test()``` werden die beiden Wertesets eingegeben. Der ausgegebene p-Wert (p-value) kann dann mit dem Signifikanzwert (typischerweise 5%(0.05)) verglichen werden. Ist der Wert grösser als 0.05 kann man annehmen, dass die Hypothese stimmt. Einen Testdurchschnitt kann man mit dem Parameter ```mu={value}``` angeben. R hat Funktionen zum Testen von Hypothesen. Hier kann man nun den [T-Test](https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/t.test) anwenden. In der Funktion ```t.test()``` werden die beiden Wertesets eingegeben. Der ausgegebene p-Wert (p-value) kann dann mit dem Signifikanzwert (typischerweise 5%(0.05)) verglichen werden. Ist der Wert groesser als 0.05 kann man annehmen, dass die Hypothese stimmt. Einen Testdurchschnitt kann man mit dem Parameter ```mu={value}``` angeben.
```{r hypothesis-test, exercise=TRUE, exercise.lines=4} ```{r hypothesis-test, exercise=TRUE, exercise.lines=4}
ptime <- gameData$"Play Time" ptime <- gameData$"Play Time"
...@@ -457,11 +457,11 @@ Lino ist verantwortlich für die Ausarbeitung des Datenanalyse-Abschnitts. ...@@ -457,11 +457,11 @@ Lino ist verantwortlich für die Ausarbeitung des Datenanalyse-Abschnitts.
### Maximilian Fronmüller ### Maximilian Fronmüller
Maximilian hat sich auf die Erstellung des Ergebnispräsentation-Abschnitts konzentriert. Maxi hat sich auf die Erstellung des Ergebnispräsentation-Abschnitts konzentriert.
### Nikolay Nikolaev ### Nikolay Nikolaev
Nikolay hat an den Abschnitten Datenbasis und Datenaufbereitung gearbeitet. Nikolay hat an die Abschnitte Datenbasis und Datenaufbereitung gearbeitet.
......
This diff is collapsed.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment