In diesem Teil wird beschrieben, wie man verschiedene Daten mit Funktionen ermitteln kann.\
Hierfuer sollte man sich die Daten erneut anschauen.\
Fuer diesen Teil ist es wichtig zu wissen, wie man auf eine Spalte zugreifen kann. Dies macht man in dem man die Variable in dem der Datensatz gespeichert ist (hier gameData) angibt und den Spaltennamen in entweder zwei eckigen Klammern oder hinter einem $ Zeichen definiert.\
Die Syntax waere dann beispielsweise:\
```data[["column"]])``` oder ```data$column```, bzw. ```data$"spaced column name"```\
\
Die Tabelle unten zeigt alle Daten aus dem Datensatz. Mit den Pfeilen in der oberen Reihe kann man die durch die Spalten schalten.
```{r dataset-tale}
head(gameData)
```
\
### Mittelwert
Der Mittelwert bestimmt den Durchschnitt aller gegebenen Werte. Die Rechnung dafuer ist:\
$(x_{1} + x_{2} + \cdots + x_{n}) / x$\
\
Um den Mittelwert einer Spalte zu bestimmen, vewendet man die 'mean()' Funktion verwenden. In diese setzt man die Variable in der die Daten gespeichert sind (gameData) und gibt die gewuenschte Spalte an.\
\
Bestimmen Sie den Mittelwert von "Play Time".
```{r mean, exercise=TRUE}
```
Sie sollten hier den Wert 99.884 bekommen.
\
### Median
Der Median ist der Mittelpunkt aller gegebenen Werte.\
\
Der Median wird durch die 'median()' Funktion bestimmt.\
Da das schreiben von ```gameData[["Play Time"]]``` etwas dauert, kann man ab hier die Variable 'ptime' verwenden.\
Bestimmen Sie den Median von "Play Time".
```{r median, exercise=TRUE}
ptime <- gameData[["Play Time"]]
```
Sie sollten hier den Wert 90 bekommen.
\
### Varianz
Die Varianz bestimmt die Verteilung um den Mittelwert.\
\
Die Varianz wird durch die 'var()' Funktion bestimmt.\
Bestimmen sie die Varianz von "Play Time".
```{r variance, exercise=TRUE}
ptime <- gameData$"Play Time"
```
Sie sollten hier den Wert 6070.055 bekommen.
\
### Standardabweichung
Die Standardabweichung bestimmt die Wurzel Verteilung um den Mittelwert.\
\
Die Varianz wird durch die 'sd()' Funktion bestimmt.\
Bestimmen sie die Standardabweichung von "Play Time".
```{r standard-deviation, exercise=TRUE}
ptime <- gameData$"Play Time"
```
Sie sollten hier den Wert 77.91056 bekommen.
\
### Lineare Regression
Die Lineare Regression bestimmt das Verhaeltnis zwischen zwei Werten(-sets).\
\
Die Varianz wird durch die 'lm()' Funktion bestimmt Hier uebergibt man Daten welche mit einem Tilde-Symbol (~) verbunden sind, also beispielsweise ```lm(x~y)```.\
Bestimmen sie die Lineare Regression mit "Users Rated" im Verhaeltnis zu "Owned Users".
```{r linear-regression, exercise=TRUE}
raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users"
```
Falls man etwas mehr information will, kann man die Eingabe (oder die Variale in welche man dies gespeichert hat) noch in die ```summary()``` Funktion schreiben.\
Weiterhin kann man dies auf ein Plot abbilden. Dazu verwendet man die ```plot()``` Funktion in welche man einen x und y Wert eingibt, zusammen mit Optionen wie das Plot aussehen soll. Mehr information dazu findet man [in der Dokumentation](https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/plot).\
Mit ```abline()``` kann man die Regressionslinie der lm Funktion abbilden. Dazu wird die lm Funktion, oder die Variable in der diese gespeichert ist, an ```abline()``` uebergeben.
```{r lm-plot-example}
raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users"
x = lm(raters~owned, data = gameData)
plot(raters, owned, pch = 16, col = "blue")
abline(x)
```
Versuchen Sie nun den oben gezeigten Plot selbst zu erstellen. Die Farbe und Parameter sind bereits vorgegeben.
```{r lm-plot, exercise=TRUE, exercise.lines=5}
raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users"
x = lm()
plot(, , pch = 16, col = "blue")
```
Mithilfe der Linearen Regression kann man nun die Hypothesen entweder beweisen oder widerlegen.
\
### Hypothesentest
```{r hypothesis-quiz}
quiz(
question("Spiele mit hoeherem Complexity Score haben eine niedrigere Anzahl von Owned Users.",
answer("Wahr", correct = TRUE),
answer("Falsch")
),
question("Spiele mit hoeherem Complexity haben hoehere Play Time.",