Posted on 2014/07/12, 11:45 PM By admin22
クラスター分析というものをやってみました。近いデータをグルーピングして表示するのに樹形図(デンドグラム)を使いました。
1 2 3 4 5 6 7 8 9 10 |
par(col.axis='firebrick2', col.lab='white', bg='gray33', fg='white') m <- matrix(c(1,1,1,2,2,2,3,1,3,4,1,1,5,5,5,6,4,2),6,3, byrow=T) rownames(m)<-c("A","B","C","D","E","F") colnames(m)<-c("X","Y","Z") plot(data.frame(m),col='yellow') d<-dist(m) hc = hclust(d) plot(hc) |
mがサンプルデータマトリックス、dがデータ間の距離を表しています。
距離はX,Y,Zそれぞれの距離の2乗和の平方になります。
B-Dなら、
(2-4)^2 + (2-1)^2 + (2-1) ^2 = 6
√6 = 2.449489…
この方法で導き出した距離をもとにグルーピングされます。
Categories: 未分類 タグ: R