Análisis Cluster No Jerárquico k-means en R (Ejemplo simple)

Uso: Determina la relación entre casos. Variables : Métricas. Descripción: Agrupamiento no jerárquico, en los que el número de grupos se determina a priori y las observaciones se van asignando a los grupos en función de su cercanía. Ejemplo en R: Clasificar flores...

Cambiar el password de Ambari en Hortonworks

Cambiar el password de forma simple Para cambiar el password de forma simple en hortonworks, basta con: Acceder por SSH Acceder por ssh a la máquina, por defecto las credenciales son: (usuario: root, clave: hadoop) Para ello se puede usar WinSCP, Firecilla, Putty,...

Leer y escribir en formato parquet en Python

Generar datos a utilizar para leer y escribir en formato Parquet Ejemplo de datos aleatorios para utilizar en los siguientes apartados data = [] for x in range(5): data.append((random.randint(0,9), random.randint(0,9))) df = spark.createDataFrame(data, («label»,...

Leer y escribir JSON en Python

Generar datos a utilizar para leer y escribir JSON Ejemplo de datos aleatorios para utilizar en los siguientes apartados data = [] for x in range(5): data.append((random.randint(0,9), random.randint(0,9))) df = spark.createDataFrame(data, («label», «data»)) df.show()...

Fechas en Python

Crear fecha a partir de un String import pandas as pd startdate = «10/10/2018» my_date = pd.to_datetime(startdate) print(my_date.strftime(«%Y-%m-%d»)) 2018-10-10 Crear fecha actual import datetime my_date = datetime.datetime.now() print(my_date.strftime(«%Y-%m-%d»))...