pandas 条件筛选并赋值如何优化?
程序代码:
df1 = pd.DataFrame(np.zeros(shape=(5, 5))) df2 = pd.DataFrame(np.random.uniform(0, 1, size=df1.shape)) df1[df2>0.5] = 1 # 当shape较大时这一步会相当耗时,比如把(5, 5)变成(5000,5000)
有什么办法优化?
这里显然是可以并行的,例如有没有办法先改造成 applymap,再替换成 parallel_applymap?
或者有其他库?最好对代码的改动尽量小,因为程序中有非常多类似的地方需要优化。