我正在尝试预测数据集,该数据集具有不同字符串的列。例如,有3个品牌,'A', 'B'和'c',我想用数字替换它们(例如,0,1和2)。

如果只有2个品牌,使用pd.eq,我知道如何做到这一点,

我试图使用set,但我想知道是否有一个更简单的方法来做到这一点,因为我必须用有超过5个不同字符串的列替换它,这将是非常烦人的。

分析解答

您可以通过选择符合这些条件的记录来替换它们,假设您在df中具有数据,并且感兴趣的列是'Brand'

replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
    df.loc[df['Brand'] == key, 'Brand'] = value