Graficar Kmeans con clase conocida

 In Blogs

Este post fue publicado originalmente en Data Mining con R por noreply@blogger.com (Enmanuel Santana)

Si se tienen datos con una clase definida, y se quiere saber qué tan bien pude segmentar el algoritmo Kmeans estas clases (para clases futuras), puede usarse PCA para graficar las observaciones.

En el siguiente gráfico se asigna un color diferente a cada cluster, y un símbolo diferente a cada clase conocida, para identificar donde se “equivocó” el cluster.

NOTA:
Para otro ejemplo de graficar Kmeans ver publicacion AQUI.
Para concepto de Kmeans, ver publicacion AQUI

El script seria este:

modelo.km <- kmeans(iris[,-5],3)
acp       <- prcomp(iris[,-5])    
data.grf  <- data.frame( pca1  = acp$x[,1],
                         pca2  = acp$x[,2],
                         color = modelo.km$cluster)
plot(data.grf[,1:2],col=data.grf[,3], pch=as.integer(iris[,5]))
Recommended Posts

Start typing and press Enter to search