3
我正在研究一个具有24个vCPU的Google云计算实例。运行的代码如下使用Dask中的所有内核
import dask.dataframe as dd
from distributed import Client
client = Client()
#read data
logd = (dd.read_csv('vol/800000test', sep='\t', parse_dates=['Date'])
.set_index('idHttp')
.rename(columns={'User Agent Type':'UA'})
.categorize())
当我运行它(这也是后数据分析,我加载数据后做的情况下),我可以看到使用11个芯,有时4.
有什么办法可以更好地控制这个,并充分利用核心?
图片看起来很不错。我可以知道如何绘制上面的图片吗? –