我正在尝试预测数据集,该数据集具有不同字符串的列。例如,有3个品牌,'A', 'B'和'c',我想用数字替换它们(例如,0,1和2)。
如果只有2个品牌,使用pd.eq
,我知道如何做到这一点,
我试图使用set
,但我想知道是否有一个更简单的方法来做到这一点,因为我必须用有超过5个不同字符串的列替换它,这将是非常烦人的。
分析解答
您可以通过选择符合这些条件的记录来替换它们,假设您在df
中具有数据,并且感兴趣的列是'Brand'
:
replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
df.loc[df['Brand'] == key, 'Brand'] = value