Normalizar DataFrames en Python

por | Ene 16, 2018 | Python | 1 Comentario

La normalización aplicada en este caso sigue la siguiente formula:

normalización = ( x – min(x) ) / ( max(x) – min(x) )

 

import pandas as pd
from sklearn.preprocessing import MinMaxScaler

x1 = [1,2,3,4,5] 
x2 = [1,2,3,4,5] 
x3 = [1,2,3,4,5] 
df = pd.DataFrame({"x1": x1, "x2": x2, "x3": x3})

scaler = MinMaxScaler()
scaled_df = scaler.fit_transform(df)
scaled_df = pd.DataFrame(scaled_df, columns=['x1', 'x2', 'x3'])
print scaled_df
x1 x2 x3 
0 0.00 0.00 0.00 
1 0.25 0.25 0.25 
2 0.50 0.50 0.50 
3 0.75 0.75 0.75 
4 1.00 1.00 1.00

1 Comentario

  1. Cristian

    La formula como se aplica, cual es el beneficio de realizar esta transformación.
    Por ultimo como puedo luego identificar los datos originales

    Responder

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *