#Aufgabe1 #a #i #Frauen haben relativ haeufiger Stochastik oder Numerik als Schwerpunkt spineplot(table(FachGruppe, Geschlecht)) #WIMA vor allem bei Wiso, Stochastik und Optimierung anzutreffen #Mathematiker in Algebra, Analysis und Numerik spineplot(table(Studienrichtung,FachGruppe)) #Maennliche Mathematiker neigen zu Informatik, weibliche zu Numerik und Informatik #Maennliche WIMAs neigen zu Optimierung und WISO, weibliche zu Stochastik mosaicplot(table(Geschlecht, Studienrichtung, FachGruppe)) #ii #Maenner haben bessere Noten als Frauen spineplot(table(Geschlecht,Dnote)) boxplot(Dnote~Geschlecht) #Mathematiker haben bessere Notan als WIMAs spineplot(table(Studienrichtung,Dnote)) boxplot(Dnote~Studienrichtung) #Sehr gute Noten gibt es in Algebra, relativ schlechte in Stochastik und Optimierung spineplot(table(FachGruppe,Dnote)) boxplot(Dnote~FachGruppe) #b summary(lm(Dnote~Geschlecht + FachGruppe + Studienrichtung)) #Geschlecht und Studienrichtung sollten auf jeden Fall ins Modell aufgenommen werden, #Die Variable FachGruppe ist allerdings Grenzwertig. #Allerdings sind alle Modelle nicht sonderlich gut. #Aufgabe2 #Aufgabe3 #a hist(Total.Bill.in...incl..Tax,freq = F) lines(density(Total.Bill.in...incl..Tax)) JavaGD() hist(Tip.in.., freq = F) lines(density(Tip.in..)) #Eventuelle Anpassungen unter anderem mittels bandwith(bw) und #verschiedenen Kernen(kernel) mšglich. #b #Die Werte scheinen ins negative zu gehen, was natuerlich nicht sein kann. #Deshalb sind die Schaetzer am linken Rand nicht gut. #Man koennte sich spezielle Schaetzer erstellen, die diesem Problem Rechnung tragen. #c plot(Total.Bill.in...incl..Tax, Tip.in..) abline(lm(Tip.in..~ Total.Bill.in...incl..Tax), col = "black") lines(lowess(Total.Bill.in...incl..Tax,Tip.in.., f=0.1), col = "darkgreen") lines(lowess(Total.Bill.in...incl..Tax,Tip.in.., f=0.25), col = "magenta") lines(lowess(Total.Bill.in...incl..Tax,Tip.in.., f=0.8), col = "darkblue") #Ich wŸrde einen hohen Span-Wert (mindestens 0.25) vorschlagen, da nur die generelle #Entwicklung des Trinkgeldes von Interesse ist und ich daher kleinere Schwankungen #komplett weg glŠtten mšchte. #Aufgabe4 #a median(Tip.in...of.Bill) #b w<-seq(length = 24400) A<-matrix(w, ncol = 244) for(i in 1:100){A[i,]<-sample(Tip.in...of.Bill,244,replace = TRUE)} m<-seq(length = 100) for(i in 1:100){m[i]<-median(A[i,])} #c mUr<-rep(median(Tip.in...of.Bill),100) abw<-abs(m-mUr) mean(abw) sd(abw) #d #Die durchschnittliche Abweichung des Medians ist sehr gering, wie auch seine SD, #da er z.B. resistent gegenueber Ausreissern ist. #Standardfehler ist definiert als Quotient aus der Standardabweichung und Wurzel #des Stichprobenumfangs. #Aufgabe5 #a Stud<-seq(length=9) Stud<-rnorm(9, mean=180, sd=8.4) lb<-mean(Stud) - 1.96*sd(Stud)/3 ub<-mean(Stud) + 1.96*sd(Stud)/3 plot(0,0,xlab = "Koerpergroesse", ylab= "Stichprobe",xlim=range(c(160,200)),ylim=range(c(0,100))) abline(v=180) for(i in 1:100){Stud<-rnorm(9, mean=180, sd=8.4) lines(c(mean(Stud) - 1.96*sd(Stud)/3, mean(Stud) + 1.96*sd(Stud)/3),c(i,i)) } #b #Nein, da es nur 95% KIs sind. #c stud.boot<-boot(Stud, function(x,i) mean(x[i]), R = 1000) stud.boot plot(stud.boot) studci<-boot.ci(stud.boot,conf=0.95, type=c("basic", "perc", "norm")) studci #Bootstrapping liefert ebefalls gute Ergebnisse (geringer Bias und geringe SD) #QQ-Plot ist sehr gut und die KIs enthalten mŸ.