por Diego Calvo | Oct 20, 2018 | R
Uso: Determina la relación entre casos. Variables : Métricas. Descripción: Agrupamiento no jerárquico, en los que el número de grupos se determina a priori y las observaciones se van asignando a los grupos en función de su cercanía. Ejemplo en R: Clasificar flores... por Diego Calvo | Oct 11, 2018 | Big data, Trucos
Cambiar el password de forma simple Para cambiar el password de forma simple en hortonworks, basta con: Acceder por SSH Acceder por ssh a la máquina, por defecto las credenciales son: (usuario: root, clave: hadoop) Para ello se puede usar WinSCP, Firecilla, Putty,... por Diego Calvo | Oct 10, 2018 | Big data, Python
Generar datos a utilizar para leer y escribir en formato Parquet Ejemplo de datos aleatorios para utilizar en los siguientes apartados data = [] for x in range(5): data.append((random.randint(0,9), random.randint(0,9))) df = spark.createDataFrame(data, («label»,... por Diego Calvo | Oct 9, 2018 | Big data, Python
Generar datos a utilizar para leer y escribir JSON Ejemplo de datos aleatorios para utilizar en los siguientes apartados data = [] for x in range(5): data.append((random.randint(0,9), random.randint(0,9))) df = spark.createDataFrame(data, («label», «data»)) df.show()... por Diego Calvo | Sep 24, 2018 | Python
Crear fecha a partir de un String import pandas as pd startdate = «10/10/2018» my_date = pd.to_datetime(startdate) print(my_date.strftime(«%Y-%m-%d»)) 2018-10-10 Crear fecha actual import datetime my_date = datetime.datetime.now() print(my_date.strftime(«%Y-%m-%d»))...