La normalización aplicada en este caso sigue la siguiente formula:
normalización = ( x – min(x) ) / ( max(x) – min(x) )
import pandas as pd from sklearn.preprocessing import MinMaxScaler x1 = [1,2,3,4,5] x2 = [1,2,3,4,5] x3 = [1,2,3,4,5] df = pd.DataFrame({"x1": x1, "x2": x2, "x3": x3}) scaler = MinMaxScaler() scaled_df = scaler.fit_transform(df) scaled_df = pd.DataFrame(scaled_df, columns=['x1', 'x2', 'x3']) print scaled_df
x1 x2 x3 0 0.00 0.00 0.00 1 0.25 0.25 0.25 2 0.50 0.50 0.50 3 0.75 0.75 0.75 4 1.00 1.00 1.00
La formula como se aplica, cual es el beneficio de realizar esta transformación.
Por ultimo como puedo luego identificar los datos originales