我是一个dataframe(df1),其一个类别列为
df1=pd.Dataframe({'COL1': ['AA','AB','BC','AC','BA','BB','BB','CA','CB','CD','CE']})
我有另一个具有两列的dataframe(df2)
df2=pd.Dataframe({'Category':['AA','AB','AC','BA','BB','BC','CA','CB','CC','CD','CE','CF'],'general_mapping':['A','A','A','B','B','B','C','C','C','C','C','C']})
我需要使用df2修改df1,最后看起来像:
df1->> ({'COL1': ['A','A','B','A','B','B','B','C','C','C','C']})
分析解答
使用df.set_index
将Category
设置为索引后,可以使用pd.Series.map
。
df1['COL1'] = df1['COL1'].map(df2.set_index('Category')['general_mapping'])
df1
COL1
0 A
1 A
2 B
3 A
4 B
5 B
6 B
7 C
8 C
9 C
10 C