我在Python中使用多处理进行并行化。 我想并行化使用大熊猫从Excel文件读取的数据块上的进程。python多进程,多进程运行相同的指令
我是新来的多处理和并行处理。在实施过程中对简单的代码,
import time;
import os;
from multiprocessing import Process
import pandas as pd
print os.getpid();
df = pd.read_csv('train.csv', sep=',',usecols=["POLYLINE"],iterator=True,chunksize=2);
print "hello";
def my_function(chunk):
print chunk;
count = 0;
processes = [];
for chunk in df:
if __name__ == '__main__':
p = Process(target=my_function,args=(chunk,));
processes.append(p);
if(count==4):
break;
count = count + 1;
打印“你好”正在被执行多次,我猜应该建立在目标工作,而不是主代码的单个处理器。
任何人都可以建议我,我错了。