1
嵌套在Halide :: sum上的印刷循环与在tutorial中编写的最佳版本不同等。Halide sum loops嵌套
该代码为零初始化和求和提供单独的循环。
Halide::Func f("f");
Halide::Var x("x");
Halide::RDom r(0, 3);
f(x) = Halide::sum(r + x);
f.print_loop_nest();
f.realize(10);
输出:
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for x:
for r4:
sum(...) = ...
consume sum:
f(...) = ...
可以融合这个循环,或不影响性能?谢谢!
更新:保险丝这样的:
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for r4:
sum(...) = ...
consume sum:
f(...) = ...
Andrew,谢谢!现在我懂了。 –