########### # Blatt 7 # ########### #aufgabe 1 #Titanic <- read.table(".../Titanic.txt",header=T,sep="\t", quote="") attach(Titanic) #a summary(Titanic) # Passagiere der Titanic, beschrieben nach Klasse, Alter, Geschlecht, # †berlebt oder nicht. # FŠlle: 2201; Passagiere der Titanic. # Variablen: 4; Class (Crew, First, Second, Third), # Age (Adult, Child), Sex (Female, Male), Survived (No, Yes). #b # Graphiken: Benutze Barcharts und vorallem Spineplots # Highlighte Survived=Yes und schau dir das Ganze in den anderen Plots an, # um AbhŠngigkeiten zwischen den Variablen zu sehen. ibar(Sex) # auch Spineplot-Varianten benutzen ibar(Class) ibar(Age) ibar(Survived) #Tabellen table(Survived, Sex) #Bei Frauen Ueberlebensrate groesser als bei Maennern table(Survived, Age) #Bei Kindern Ueberlebensrate groesser als bei Erwachsenen table(Survived, Class) #Ueberlebensrate steigt mit "besserer Klasse" (von Third #zu First) #c # Nullhypothese (Unabhaengigkeitshypothese): # Unabhaengigkeit zwischen den Variablen X und Y (x1<-chisq.test(Survived, Sex)) #hoch signifikant; p<2.2e-16 x1$observed #beobachtete Haeufigkeiten x1$expected #unter H_0 (Unabhaengigkeit) erwartete Haeufigkeiten (x2<-chisq.test(Survived, Age)) #hoch signifikant; p=7.725e-06 x2$observed x2$expected (x3<-chisq.test(Survived, Class)) #hoch signifikant; p=2.2e-16 x3$observed x3$expected #Bei allen drei Tests liegt hohe Signifikanz vor; es liegen somit #klare Abhaengigkeiten zwischen den Variablen (Survived gegen Sex, # Survived gegen Age, Survived gegen Class) vor. #aufgabe 4 #a binom.test(379,2556,620/2595) #p-Wert<2.2e-16 ist extrem klein, #daher kann die Nullhypothese H_0: p=620/2595 verworfen werden. #b # Normalapproximation: n=2556, p_0=620/2595 #Varianz sigma<- 620/2595 * (1-620/2595) * 2556 #Erwartungswert erw<- 2556 * 620/2595 #Teststatistik (stat<- (379 - erw) * sqrt(1/sigma)) #T=-10.74657 #p-Wert 2*(1-pnorm(abs(stat))) #hoch signifikant p=0; H_0 ablehnen #Normalapproximation zeigt aehnliches Ergebnis wie oben #aufgabe 3, (a) x_11<-((2350-(4687*2471)/5005)^2)/((4687*2471)/5005) x_12<-((2337-(4687*2534)/5005)^2)/((4687*2534)/5005) x_21<-((121-(318*2471)/5005)^2)/((318*2471)/5005) x_22<-((197-(318*2534)/5005)^2)/((318*2534)/5005) (x<-x_11+x_12+x_21+x_22) # X^2=17.40933 # 0.95-Quantil chi^2_1 ist 3.84. X^2>3.84, damit H_0 ablehnen. #p-Wert 1-pchisq(17.40933,1) #hoch signifikant; p=3.013432e-05