我有一个具有a
b
列的dataframe。我想在同一dataframe架中创建另一列的列,该列的值(每行)应为a*b
。我怎么做?
我尝试了几个例子,但没有一个正在起作用
short_df['Revenue'] = short_df.(lambda row: (row['UnitPrice']*row['Quantity']))
display(short_df.limit(10))
分析解答
除非我缺少某些东西,否则我们有一个微不足道的解决方案
import pyspark.sql.functions as F
short_df = short_df.withColumn('Revenue', F.col('UnitPrice') * F.col('Quantity'))