我有一个Pandas DataFrame:
column1 | column2 | column3
1 | 4 | 10.4
4 | 7 | 11.1
3 | 3 | 3.3
我如何计算整个列的平方值的总和(我正在尝试像deviation = df[columnName].pow(2).sum()
的东西,但非常欢迎思想!)还是识别具有最小的列和实际最小的列和实际最小的列还
编辑:添加所需的输出
在这种情况下需要的输出是:
Minimum sum of squared values: 26
Column containing minimum sum of squared values: column1
分析解答
您可以计算整个数据帧上的正方之和,该dataframe架将具有列名称的系列对象作为索引。然后,您可以使用min
和idxmin
找到最小值以及最小索引:
col_squares = df.pow(2).sum()
col_squares
#column1 26.00
#column2 74.00
#column3 242.26
#dtype: float64
col_squares.min(), col_squares.idxmin()
#(26.0, 'column1')