Skip to content
Snippets Groups Projects
Commit dc26b8a8 authored by Maximilian Fronmüller's avatar Maximilian Fronmüller
Browse files

Merge branch 'nikobranch' of...

Merge branch 'nikobranch' of https://gitlab.reutlingen-university.de/cortese/tutoRial into nikobranch

# Conflicts:
#	tutorial_page.Rmd
#	tutorial_page.html
parents 5072db06 aaeba421
No related branches found
No related tags found
1 merge request!1Nikobranch
......@@ -25,7 +25,7 @@ Link zum Datensatz auf Kaggle: https://www.kaggle.com/code/karnikakapoor/board-g
### Inhalt
Der Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Aus Darstellungsgründen wurde der Datensatz allerdings auf 500 Einträge reduziert. Hier sind die Spalten und ihre jeweiligen Inhalte:
Der Originale Datensatz umfasst 20.343 Einträge und enthält verschiedene Informationen zu Brettspielen. Allerdings wurde der Datensatz für diese Übung auf 500 Einträge gekürzt. Hier sind die Spalten und ihre jeweiligen Inhalte:
**ID**: Eine eindeutige Identifikationsnummer für jedes Brettspiel im Datensatz.*(Integer)*\
**Name:** Der Name des Brettspiels.*(String)*\
......@@ -217,9 +217,9 @@ quiz(
## Datenanalyse
In diesem Teil wird beschrieben, wie man verschiedene Daten mit Funktionen ermitteln kann.\
Hierfür sollte man sich die Daten erneut anschauen.\
Für diesen Teil ist es wichtig zu wissen, wie man auf eine Spalte zugreifen kann. Dies macht man in dem man die Variable in dem der Datensatz gespeichert ist (hier gameData) angibt und den Spaltennamen in entweder zwei eckigen Klammern oder hinter einem $ Zeichen definiert.\
Die Syntax wäre dann beispielsweise:\
Hierfuer sollte man sich die Daten erneut anschauen.\
Fuer diesen Teil ist es wichtig zu wissen, wie man auf eine Spalte zugreifen kann. Dies macht man in dem man die Variable in dem der Datensatz gespeichert ist (hier gameData) angibt und den Spaltennamen in entweder zwei eckigen Klammern oder hinter einem $ Zeichen definiert.\
Die Syntax waere dann beispielsweise:\
```data[["column"]])``` oder ```data$column```, bzw. ```data$"spaced column name"```\
\
Die Tabelle unten zeigt alle Daten aus dem Datensatz. Mit den Pfeilen in der oberen Reihe kann man die durch die Spalten schalten.
......@@ -230,10 +230,10 @@ head(gameData)
### Mittelwert
Der Mittelwert bestimmt den Durchschnitt aller gegebenen Werte. Die Rechnung dafür ist:\
Der Mittelwert bestimmt den Durchschnitt aller gegebenen Werte. Die Rechnung dafuer ist:\
$(x_{1} + x_{2} + \cdots + x_{n}) / x$\
\
Um den Mittelwert einer Spalte zu bestimmen, vewendet man die 'mean()' Funktion verwenden. In diese setzt man die Variable in der die Daten gespeichert sind (gameData) und gibt die gewünschte Spalte an.\
Um den Mittelwert einer Spalte zu bestimmen, vewendet man die 'mean()' Funktion verwenden. In diese setzt man die Variable in der die Daten gespeichert sind (gameData) und gibt die gewuenschte Spalte an.\
\
Bestimmen Sie den Mittelwert von "Play Time".
```{r mean, exercise=TRUE}
......@@ -284,18 +284,18 @@ Sie sollten hier den Wert 77.91056 bekommen.
### Lineare Regression
Die Lineare Regression bestimmt das Verhältnis zwischen zwei Werten(-sets).\
Die Lineare Regression bestimmt das Verhaeltnis zwischen zwei Werten(-sets).\
\
Die Varianz wird durch die 'lm()' Funktion bestimmt Hier übergibt man Daten welche mit einem Tilde-Symbol (~) verbunden sind, also beispielsweise ```lm(x~y)```.\
Bestimmen sie die Lineare Regression mit "Users Rated" im Verhältnis zu "Owned Users".
Die Varianz wird durch die 'lm()' Funktion bestimmt Hier uebergibt man Daten welche mit einem Tilde-Symbol (~) verbunden sind, also beispielsweise ```lm(x~y)```.\
Bestimmen sie die Lineare Regression mit "Users Rated" im Verhaeltnis zu "Owned Users".
```{r linear-regression, exercise=TRUE}
raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users"
```
Falls man etwas mehr Information will, kann man die Eingabe (oder die Variale in welche man dies gespeichert hat) noch in die ```summary()``` Funktion schreiben.\
Falls man etwas mehr information will, kann man die Eingabe (oder die Variale in welche man dies gespeichert hat) noch in die ```summary()``` Funktion schreiben.\
Weiterhin kann man dies auf ein Plot abbilden. Dazu verwendet man die ```plot()``` Funktion in welche man einen x und y Wert eingibt, zusammen mit Optionen wie das Plot aussehen soll. Mehr information dazu findet man [in der Dokumentation](https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/plot).\
Mit ```abline()``` kann man die Regressionslinie der lm Funktion abbilden. Dazu wird die lm Funktion, oder die Variable in der diese gespeichert ist, an ```abline()``` übergeben.\
Mit ```abline()``` kann man die Regressionslinie der lm Funktion abbilden. Dazu wird die lm Funktion, oder die Variable in der diese gespeichert ist, an ```abline()``` uebergeben.\
```{r lm-plot-example}
raters <- gameData$"Users Rated"
owned <- gameData$"Owned Users"
......@@ -318,7 +318,7 @@ plot(, , pch = 16, col = "blue")
### Hypothesentest
R hat Funktionen zum Testen von Hypothesen. Hier kann man nun den [T-Test](https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/t.test) anwenden. In der Funktion ```t.test()``` werden die beiden Wertesets eingegeben. Der ausgegebene p-Wert (p-value) kann dann mit dem Signifikanzwert (typischerweise 5%(0.05)) verglichen werden. Ist der Wert grösser als 0.05 kann man annehmen, dass die Hypothese stimmt. Einen Testdurchschnitt kann man mit dem Parameter ```mu={value}``` angeben.
R hat Funktionen zum Testen von Hypothesen. Hier kann man nun den [T-Test](https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/t.test) anwenden. In der Funktion ```t.test()``` werden die beiden Wertesets eingegeben. Der ausgegebene p-Wert (p-value) kann dann mit dem Signifikanzwert (typischerweise 5%(0.05)) verglichen werden. Ist der Wert groesser als 0.05 kann man annehmen, dass die Hypothese stimmt. Einen Testdurchschnitt kann man mit dem Parameter ```mu={value}``` angeben.
```{r hypothesis-test, exercise=TRUE, exercise.lines=4}
ptime <- gameData$"Play Time"
......@@ -457,11 +457,11 @@ Lino ist verantwortlich für die Ausarbeitung des Datenanalyse-Abschnitts.
### Maximilian Fronmüller
Maximilian hat sich auf die Erstellung des Ergebnispräsentation-Abschnitts konzentriert.
Maxi hat sich auf die Erstellung des Ergebnispräsentation-Abschnitts konzentriert.
### Nikolay Nikolaev
Nikolay hat an den Abschnitten Datenbasis und Datenaufbereitung gearbeitet.
Nikolay hat an die Abschnitte Datenbasis und Datenaufbereitung gearbeitet.
......
This diff is collapsed.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment