Normalizar DataFrames en Python

La normalización aplicada en este caso sigue la siguiente formula: normalización = ( x – min(x) ) / ( max(x) – min(x) )   import pandas as pd from sklearn.preprocessing import MinMaxScaler x1 = [1,2,3,4,5] x2 = [1,2,3,4,5] x3 = [1,2,3,4,5] df =...

Estandarizar DataFrames en Python

La estandarización aplicada en este caso sigue la siguiente formula: normalización = ( x – media ) / desviación típica from scipy import stats import numpy as np from scipy import stats import numpy as np x1 = [1,2,3,4,5] x2 = [1,2,3,4,5] x3 = [1,2,3,4,5] df =...

Ordenar RDDs Apache Spark en Python

Ordenar los 5 primeros elementos del RDD print (rdd.takeOrdered(5)) [1, 1, 1, 1, 2] Ordenar inversamente los 5 primeros elementos del RDD print(rdd.takeOrdered(5, lambda x: -x)) [4, 3, 3, 2, 2] Ordena todo el RDD y devuelve otro RDD rdd_aux = rdd.sortBy(lambda x: x)...