Análisis Cluster (Cluster Jerárquicos y No Jerárquicos)

Definición de análisis cluster

El Análisis cluster es una técnica de análisis exploratorio utilizada para resolver problemas de clasificación.
Se encuadra en los métodos de aprendizaje no supervisado.

Su objetivo es ordenar objetos (definidos por un conjunto de variables) en grupos de forma que los miembros del grupo sean lo más homogéneos posibles y los más heterogéneos entre miembros de distintos grupos

El análisis de cluster permite descubrir asociaciones y estructuras que no son evidentes a priori pero que pueden ser útiles una vez que se han detectado. Las estructuras encontradas pueden utilizarse para la definición formal de un esquema de clasificación (taxonomía).

Los métodos más utilizados de clusterización se dividen en dos grandes grupos: jerárquicos y no jerárquicos.

Análisis Cluster jerárquico vs Análisis Cluster no jerárquico

Análisis Cluster jerárquico vs Análisis Cluster no jerárquico

Clasificación de métodos de clustering

Clasificación de métodos de análisis cluster

Clasificación de métodos de clustering

Cluster jerárquico Cluster no jerárquico

 

Análisis Cluster Jerárquicos (Hierarchical Cluster)

Los métodos jerárquicos o agrupamientos jeraquicos van generando grupos en cada una de las fases del proceso buscando el número de clusters que hacer una agrupación óptima.

El agrupamiento jerárquico es capaz de fijar por si solos el número de clusters, por ello se pueden utilizar de forma exploratoria y posteriormente aplicar un análisis no jerárquico con el número de clusters ya fijado.

Las estrategias para conseguir este objetivo se dividen en: estrategias aglomerativas y divisivas

Métodos

  • Método del vecino más próximo (nearest neighbor clustering)  o Enlace simple (Single linkage clustering)
  • Método del vecino más lejano (furthest neighbor clustering) o Enlace completo (Complete Linkage clustering)
  • Método de agrupación de vinculación promedio (Average linkage clustering) o Vinculación inter-grupo (unweighted Pair-group arithmetic averages (UPGMA))
  • Método de Ward o Varianza mínima (Minimum variante clustering)
  • Método del Centroide
  • Método de la Mediana

Conviene comentar que a estos métodos se les puede aplicar tanto las estrategias aglomerativas como divisivas.

 

Análisis Cluster No Jerárquicos (Partitioning Cluster)

Los métodos no jerárquicos categorizan los elementos según un número de cluster dado.

Necesitan que el número de particiones esté fijado a priori.

Métodos

Métodos de reasignación

  • k-means (centroides)
  • k-medoids o PAM (medioides)
  • Clara (medioides)
  • Quick-cluster (centroides)
  • Método de Forgy (centroides)
  • Nubes dinámicas

Métodos de búsqueda de densidad

  • Análisis Modal (aproximación tipológica)
  • Método Taxmap (aproximación tipológica)
  • Método de Fortin (aproximación tipológica)
  • Método de Wolf (aproximación probabilística)

Métodos directos

  • Block-Clustering

Métodos reducidos

  • Análisis Factorial tipo Q.

Otros artículos que pueden ser de interés:

Autor: Diego Calvo