SSブログ

t検定と分散分析の違い [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
t検定と分散分析の違いが分かりません。

【回答】
t検定は、一つの変数の効果について差があるかどうかを検定します。
F検定は、t検定と同じく一つの変数について検定もできるが、一般的には二つ以上の変数について検定する手法です。

一つの変数に適用した場合、t検定とF検定が一致します。
F検定一つ覚えておけば、t検定は不要なのですが、t検定の方が理解がしやすいってのがあるのかもしれません。

以下の通り、t検定とF検定の結果は一致します。

# t検定
A.sales <- c(1000, 980, 1200, 1260, 1500, 1005, 820, 1490, 1500, 960)
B.sales <- c(880, 1080, 1580, 2180, 1900, 1950, 1200, 910, 2100, 1890)
t.test(A.sales, B.sales, var.equal = T)

# t検定の結果
# t = -2.2088, df = 18, p-value = 0.04039

# F検定
sales <- c(A.sales, B.sales)
campaign.B <- c(rep(0,length(A.sales)), rep(1,length(B.sales)))
df <- as.data.frame(cbind(sales, campaign.B))
model.lm <- lm(sales ~ campaign.B, data=df)

# F検定の結果1
summary(model.lm)
# F-statistic: 4.879 on 1 and 18 DF, p-value: 0.04039

# F検定の結果2: 分散分析
anova(model.lm)
# campaign.B 1 782101 782101 4.879 0.04039

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0