2
我的程序有两个内核,第二个内核应该使用已经上传的输入数据和第一个内核的结果,所以我可以保存内存传输。我将如何归档这个?如何让PyCUDA重用早期内核的内存?
这是我启动我的内核:
result = gpuarray.zeros(points, dtype=np.float32)
kernel(
driver.In(dataT),result,np.int32(points),
grid = (blocks,1),
block = (block_size, 1, 1),
)