Análisis clúster no Jerárquico K-means en Spark Python

from pyspark.ml import Pipeline from pyspark.ml.feature import VectorAssembler # Definir el ‘df’ Spark a utilizar df = spark.createDataFrame([     (‘line_1’, 100, 10, 1),     (‘line_2’, 200, 20, 2),     (‘line_3’, 300, 30, 2),     (‘line_4’, 300, 30, 3),     (‘line_5’, 200, 20, 1),     (‘line_6’, 100, 10, 1) ],  («label», «x1», «x2», «x3»)) # Definir…

Read More »

Análisis Cluster No Jerárquico k-means en R

Uso: Clasificador de clases por clustering o agrupamiento, no supervisado. Descripción: El objetivo es segmentar un conjunto de datos en grupos homogéneos, disjuntos entre sí, es decir, ningún elemento formará parte de dos grupos distintos, por lo que, serán heterogéneos entre sí. Para ello, el algoritmo utiliza el Criterio de la Inercia, que indica que…

Read More »