Rを使ったマハラノビスの距離 その3 [データサイエンス、統計モデル]
irisデータを使った多変量のマハラノビス距離の計算をしたいと思います。
setosaの50レコードの中に1レコードだけversicolorを入れたらどうなるか?
割と顕著にマハラノビスの距離が大きく検出できています。
### 多変量の場合
## irisデータ
head(iris[,-5])
dat_s <- iris[1:51, -5]
# レコード1〜50は、setosa
# レコード51〜100は、versicolor
# レコード101〜150は、virginica
#平均ベクトル
m.dat<-colMeans(dat_s)
#分散共分散行列
nreg <- nrow(dat_s)
v.dat <- var(dat_s)*(nreg-1)/nreg
m.d2 <- mahalanobis(dat_s, m.dat, v.dat)
plot(m.d2)
Rを使ったマハラノビスの距離
https://skellington.blog.ss-blog.jp/2022-08-30
Rを使ったマハラノビスの距離 その2
https://skellington.blog.ss-blog.jp/2022-08-31
setosaの50レコードの中に1レコードだけversicolorを入れたらどうなるか?
割と顕著にマハラノビスの距離が大きく検出できています。
### 多変量の場合
## irisデータ
head(iris[,-5])
dat_s <- iris[1:51, -5]
# レコード1〜50は、setosa
# レコード51〜100は、versicolor
# レコード101〜150は、virginica
#平均ベクトル
m.dat<-colMeans(dat_s)
#分散共分散行列
nreg <- nrow(dat_s)
v.dat <- var(dat_s)*(nreg-1)/nreg
m.d2 <- mahalanobis(dat_s, m.dat, v.dat)
plot(m.d2)
Rを使ったマハラノビスの距離
https://skellington.blog.ss-blog.jp/2022-08-30
Rを使ったマハラノビスの距離 その2
https://skellington.blog.ss-blog.jp/2022-08-31
コメント 0