0
我有一个非常大的多千兆字节文件,其成本太高,无法加载到内存中。但是,文件中行的排序不是随机的。有没有办法使用类似fread的行来读取行的随机子集?R:使用fread或同等文件从文件中随机读取行吗?
像这样的东西,例如?
data <- fread("data_file", nrows_sample = 90000)
这github post表明一种可能性是做这样的事情:
fread("shuf -n 5 data_file")
这不适合我,但是。有任何想法吗?