我在熊猫中有一个数据框,其中每一列都有不同的值范围。例如:
东风:
A B C 1000 10 0.5 765 5 0.35 800 7 0.09
知道如何标准化这个数据框的列,其中每个值都在 0 和 1 之间?
我想要的输出是:
A B C 1 1 1 0.765 0.5 0.7 0.8 0.7 0.18(which is 0.09/0.5)
您可以使用包 sklearn 及其相关的预处理实用程序来规范化数据。
import pandas as pd from sklearn import preprocessing x = df.values #returns a numpy array min_max_scaler = preprocessing.MinMaxScaler() x_scaled = min_max_scaler.fit_transform(x) df = pd.DataFrame(x_scaled)
有关更多信息,请查看关于预处理数据的 scikit-learn文档:将特征缩放到一个范围。