我在许多功能中看到参数npartitions
,但我不明白它对于/用于什么有好处。npartitions在Dask数据框中的作用是什么?
http://dask.pydata.org/en/latest/dataframe-api.html#dask.dataframe.read_csv
头(...)
如果有少于n行的第一个nPartition的元素只能从第一nPartition的拍摄,与1默认将显示一条警告被提出并返回任何找到的行。传递-1以使用所有分区。
再分配(...)输出的分割
数量,必须小于输入的nPartition的。仅在未指定分区时使用。
是分区的可能是在这种情况下,5的数量:
(图像源:http://dask.pydata.org/en/latest/dataframe-overview.html)