2014-10-17 63 views
1

在英特尔的条带开采例如:关于英特尔的条带开采例如

https://software.intel.com/en-us/articles/strip-mining-to-optimize-memory-use-on-32-bit-intel-architecture

为什么不合并转换和照明进入一个循环?它会解决缓存驱逐问题。

有人在评论中提出了同样的问题,但没有答案。

如果分裂循环以某种方式更快...为什么?我们应该在什么条件下分开循环?

我查看了几篇关于分裂循环的文章,但我仍然不明白。

回答

1

如果这些操作中只有一个可以被矢量化,那么将它们组合可以防止循环的矢量化。在这种情况下,将阵列分成缓存大小的条纹会更好。我不知道这是否适用于TransformLighting。如果不是,那么他们可能不一定是示范的好例子。

当循环是部分可矢量化的(是一个单词?),部分不是,裂变*通常是要走的路。

*分裂实际上是根据wikipedia

+0

啊文章中使用该技术...谢谢例如名称。 – user2873372 2014-10-17 09:31:59