########### # Blatt 1 # ########### #aufgabe 1 zk <- read.table("/Users/anatol/Desktop/†-leiter/Statistik I/Zehnkampf2006.txt",header=T,sep="\t",quote="") #Object browser, str oder class (wobei class fuer Datensaetze ungeeignet ist) str(zk) for(i in 1:ncol(zk)) print(class(zk[,i])) #Variablen #Variablen geben Auskunft ueber Punkte, Leistungen in einzelnen Disziplinen und weitere Infos (Name, Nationialitaet etc.) #aufgabe 2 cont<-c(1,6:27) mean(zk[,cont], na.rm = T) apply(zk[,cont],2, median) #NA wird nicht beruecksichtigt #median(zk[,cont]) funktioniert nicht apply(zk[,cont],2, median, na.rm = T) sd(zk[,cont], na.rm = T) apply(zk[,cont],2, var, na.rm = T) apply(zk[,cont],2,IQR, na.rm = T) apply(zk[,2:5],2,table) summary(zk[,2:5]) #Kennzahlen fuer diskrete Variablen: Modus, Tabelle, Klassen #aufgabe 3 JavaGD() pairs(zk[,cont], pch = 19) # In SPLOM erkennt man einige sehr stark negative und positive Korrelationen #SPLOM fuer Punkte pairs(zk[,c(1,18:27)], pch =19, cex.labels = 1.5) #Ausreisser z.B. in Diskuswurf, 1500m etc. #Korrelationen cor(zk[,cont], use = "complete.obs") #sehr gross, unuebersichtlich round(cor(zk[,cont], use = "complete.obs"), digits = 2) #Punkte corr<-cor(zk[,c(1,18:27)]) round(corr, digits = 3) #Zusammenhaenge zwischen sp und dt, oder 100m und lj #Gesamtpunkte haben hoechste Korrelation mit Wurfdisziplinen #!500m wenig Einfluss (jedoch 1500m letzte Disziplin) #Hochsprung hat schwache Korrelationen, evtl fuer Hochsprung Technik am wichtigsten, jedoch nicht hilfreich fuer andere Disziplinen #aufgabe 4 JavaGD() hist(zk[,18], breaks = 25, col ="grey",ylim = c(0,0.008), xlim = c(600,1100), freq = F, xlab = "Punkte 100 m") JavaGD() plot(ecdf(zk[,18]), main = "Empirische Verteilungsfunktion") summary(zk[,18]) quantile(zk[,18]) #Normalverteilung: mu<-mean(zk[,18]) sigma<-sd(zk[,18]) curve(dnorm(x,mean=mu, sd = sigma),add=T) curve(pnorm(x,mean=mu, sd = sigma),add=T,col = "magenta") #aufgabe 5 which(zk[,6] == sort(zk[,6])[338]) zk[which(zk[,6] == sort(zk[,6])[338]),3:4] zk[309,] ratio<-zk[,6] / zk[,10] which(ratio == max(ratio)) which(ratio == min(ratio)) min(ratio) max(ratio) zk[c(46,85),] temp<-zk[which(zk[,3] == "Zhu Hengjun"),6] / zk[which(zk[,3] == "Zhu Hengjun"),10] which(sort(ratio) == temp)