为特定线程配置调用CUDA内核时, 上存在哪些内存空间(设备/主机)内核参数应该存在的严格规则以及它们应该是什么类型?CUDA内核的参数
假设我启动的线程的与
kernel<<<numblocks, threadsperblock >>> (/*parameters*/)
1-d网格我可以传递一个整数参数int foo
其为主机 -integer变量, 直接向CUDA内核?或者我应该将cudaMalloc
内存的单个整数表示为dev_foo
,然后cudaMemcpy
foo
分成devfoo
,然后通过devfoo
作为内核参数?