でもデータ集めるのは前回ので懲りたので今回はネットに落ちてるデータを使用しました。
ここに置いてあるのを使いました。
https://docs.google.com/spreadsheet/ccc?key=0Aq4QtR_XsDYTdFVDMWpkd0w0UGk4dUM4YUV1WFdxaFE#gid=0
(2014/4/5の14時頃にダウンロード)
手順
①落としたデータの「宝箱」の部分は使いにくいのと、今回は「何番目の宝箱が落ちたか」ということを扱わないので、全部個数に直す。②魔導探知機とお宝好きについても興味がないので、これらについてのデータも削除。
③落ちた宝箱の個数に関するデータを「ハピトレなし」「ハピトレあり」に分け、それぞれx1,x2とする。
④x1に1.3をかける。この値は、ハピトレによって期待値が1.3倍になるという仮定が正しい時に得られるデータを表す。
⑤x1とx2に対してt検定。
【結果】
(誤差棒は±1SE)。
x1の平均値は2.74個(SD=1.097 , n=294)で、
x2の平均値は2.30個(SD=0.814 , n=1384)。
理論値=「ハピトレ無しのときのドロ数×1.3」の平均値。
実測値=「ハピトレ有りのときのドロ数」 の平均値。
理論値と実測値に有意差(t(364.45)=6.51, p < .001)。
また、ハピトレの上昇率の期待値を「ハピトレあり」/「ハピトレ無し」とすると、この値は、2.30/2.11=1.10。
【結論】
「ハピトレの上昇率は1.3倍である」という仮説は正しくない。
でもって数字だけで考えるなら1.1倍ぽい。
データの信頼性に問題があるので、参考程度に……。
【ソース】(Rを使ってやってますが、この記事自体息抜きで作ってるので無駄な部分が多いです)
#####data_input#####
dat <- read.csv("ninfa_happy_treasure2.csv",header=T)
colnames(dat) <- c("day","cond","week","dif","score")
dat$cond <- sub("アビなし","none",dat$cond); dat$cond <- sub("ハピトレ","hapitore",dat$cond);
dat$cond <- sub("魔導探知機","madou",dat$cond); dat$cond <- sub("お宝好き","otakara",dat$cond);
dat <- subset(dat,dat$cond!="madou" & dat$cond!="otakara")
junban <- c("none","hapitore")
dat$cond <- factor(dat$cond,levels=junban)
dat$week <- sub("月曜","Weekday",dat$week); dat$week <- sub("火曜","Weekday",dat$week);
dat$week <- sub("水曜","Weekday",dat$week); dat$week <- sub("木曜","Weekday",dat$week);
dat$week <- sub("金曜","Weekday",dat$week); dat$week <- sub("土日","Holiday",dat$week);
dat$dif <- sub("初級","low",dat$dif); dat$dif <- sub("中級","mid",dat$dif);
scoreRewrite <- function(dat){
ind1 <- which(dat[,5]=="1")
ind12 <- which(dat[,5]=="1, 2")
ind123 <- which(dat[,5]=="1, 2, 3")
ind1234 <- which(dat[,5]=="1, 2, 3, 4")
ind124 <- which(dat[,5]=="1, 2, 4")
ind13 <- which(dat[,5]=="1, 3")
ind134 <- which(dat[,5]=="1, 3, 4")
ind14 <- which(dat[,5]=="1, 4")
ind2 <- which(dat[,5]=="2")
t1 <- t2 <- t3 <- t4 <- rep(0,nrow(dat))
t1 <- t1+1; t1[ind2] <- 0
t2[c(ind12,ind123,ind1234,ind124,ind2)] <- 1
t3[c(ind123,ind1234,ind13,ind134)] <- 1
t4[c(ind1234,ind124,ind134,ind14)] <- 1
t1234 <- t1+t2+t3+t4
dat <- cbind(dat[,1:4],t1,t2,t3,t4,t1234)
return(dat)
}
dat <- scoreRewrite(dat) %例えばt3は、左から3番目の宝箱を示す。
%t1234はそのクエストで得られた宝箱の個数。
#####statistics#####
x1 <- dat$t1234[dat$cond=="none"]*1.3
x2 <- dat$t1234[dat$cond=="hapitore"]
t.test(x1,x2,var=F)
Welch Two Sample t-test
data: x1 and x2
t = 6.5123, df = 364.453, p-value = 2.458e-10
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.307271 0.573121
sample estimates:
mean of x mean of y
2.741497 2.301301