我读了一个excel文件并将每个标签保存为pandas dataframe。

import pandas as pd
xla = pd.ExcelFile("file_name.xlsx")
kl=xla.sheet_names
hf_list=[]
for i in range(len(kl)):   
    hf_list.append(pd.read_excel(xla, i,index_col=0))

我打算在list中计算每个dataframe的等级,因此编写了以下代码。

def score_card(raw_list):    
    score_list=[]    
    for i in range(len(raw_list)):
        score_list.append(raw_list[i].rank(axis=1))        
    return score_list

score_list=score_card(hf_list)

我想知道是否有一种方法可以对代码进行矢量化并避免score_card function中的循环(s)(以及读取excel文件)。 在此先感谢您的时间。

分析解答

如果在read_excel中使用参数sheet_name = None获取每个sheetname的DataFrames的orderdict:

dfs = pd.read_excel("file_name.xlsx", sheet_name = None, index_col=0) 

然后使用list理解:

score_list = [v.rank(axis=1) for k, v in dfs.items()]

或者使用concat创建大型DataFrame:

df = pd.concat(dfs.values())