por Adrian Atienza | Ene 17, 2018 | Python, Spark
from pyspark.ml import Pipeline from pyspark.ml.feature import VectorAssembler # Definir el ‘df’ Spark a utilizar df = spark.createDataFrame([ (‘line_1’, 100, 10, 1), (‘line_2’, 200, 20, 2), (‘line_3’, 300,... por Yeifer Rodriguez | Oct 4, 2016 | R
Uso: Clasificador de clases por clustering o agrupamiento, no supervisado. Descripción: El objetivo es segmentar un conjunto de datos en grupos homogéneos, disjuntos entre sí, es decir, ningún elemento formará parte de dos grupos distintos, por lo que, serán...