Normalizar DataFrames en Python

por Diego Calvo | Ene 16, 2018 | Python | 1 Comentario

La normalización aplicada en este caso sigue la siguiente formula:

normalización = ( x – min(x) ) / ( max(x) – min(x) )

import pandas as pd
from sklearn.preprocessing import MinMaxScaler

x1 = [1,2,3,4,5] 
x2 = [1,2,3,4,5] 
x3 = [1,2,3,4,5] 
df = pd.DataFrame({"x1": x1, "x2": x2, "x3": x3})

scaler = MinMaxScaler()
scaled_df = scaler.fit_transform(df)
scaled_df = pd.DataFrame(scaled_df, columns=['x1', 'x2', 'x3'])
print scaled_df

x1 x2 x3 
0 0.00 0.00 0.00 
1 0.25 0.25 0.25 
2 0.50 0.50 0.50 
3 0.75 0.75 0.75 
4 1.00 1.00 1.00

1 Comentario

Cristian el 6 mayo, 2020 a las 4:38 pm
La formula como se aplica, cual es el beneficio de realizar esta transformación.
Por ultimo como puedo luego identificar los datos originales
Responder

Enviar un comentario Cancelar la respuesta

Diego Calvo Data Scientist