SSブログ

Rを使ったマハラノビスの距離 その3 [データサイエンス、統計モデル]

irisデータを使った多変量のマハラノビス距離の計算をしたいと思います。

setosaの50レコードの中に1レコードだけversicolorを入れたらどうなるか?
割と顕著にマハラノビスの距離が大きく検出できています。



### 多変量の場合
## irisデータ
head(iris[,-5])

dat_s <- iris[1:51, -5]

# レコード1〜50は、setosa
# レコード51〜100は、versicolor
# レコード101〜150は、virginica

#平均ベクトル
m.dat<-colMeans(dat_s)

#分散共分散行列
nreg <- nrow(dat_s)
v.dat <- var(dat_s)*(nreg-1)/nreg

m.d2 <- mahalanobis(dat_s, m.dat, v.dat)

plot(m.d2)

Rを使ったマハラノビスの距離
https://skellington.blog.ss-blog.jp/2022-08-30

Rを使ったマハラノビスの距離 その2
https://skellington.blog.ss-blog.jp/2022-08-31

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0