大循环被intel编译器忽略了吗？

我有使用英特尔编译器执行某些定时对于大环为浮点操作的非常简单的C测试代码，该代码（test.c）如下：

#include <sys/time.h> 
#include <time.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <math.h> 
#include <omp.h> 

int main(char *argc, char **argv) { 
     const long N = 1000000000; 
     double t0, t1, t2, t3; 
     double sum=0.0; 
     clock_t start, end; 
     struct timeval r_start, r_end; 
     long i; 
     gettimeofday(&r_start, NULL); 
     start = clock(); 
     for (i=0;i<N;i++) 
      sum += i*2.0+i/2.0; // doing some floating point operations 
     end = clock(); 
     gettimeofday(&r_end, NULL); 
     double cputime_elapsed_in_seconds = (end - start)/(double)CLOCKS_PER_SEC; 
     double realtime_elapsed_in_seconds = ((r_end.tv_sec * 1000000 + r_end.tv_usec) 
       - (r_start.tv_sec * 1000000 + r_start.tv_usec))/1000000.0; 
     printf("cputime_elapsed_in_sec: %e\n", cputime_elapsed_in_seconds); 
     printf("realtime_elapsed_in_sec: %e\n", realtime_elapsed_in_seconds); 
     //printf("sum= %4.3e\n", sum); 
     return 0; 
}

然而当我试图编译和英特尔运行13.0编译器，大循环似乎被忽略和执行导致零时间：

$ icc test.c 
$ ./a.out 
cputime_elapsed_in_sec: 0.000000e+00 
realtime_elapsed_in_sec: 9.000000e-06

只有当我打印的总和（取消注释第26行），循环将实际上是exe cuted：

问题是为什么循环似乎不执行，如果我不打印总和值？

gcc-4.4.7编译器不会出现同样的问题，我想intel编译器可能会做一些优化，如果变量没有被引用，循环可能被忽略？

系统信息如下：

$ uname -a 
Linux node001 2.6.32-642.11.1.el6.x86_64 #1 SMP Wed Oct 26 10:25:23 EDT 2016 x86_64 x86_64 x86_64 GNU/Linux 
$ icc -v 
icc version 13.0.0 (gcc version 4.4.7 compatibility) 
$ gcc -v 
Using built-in specs. 
Target: x86_64-redhat-linux 
Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-languages=c,c++,objc,obj-c++,java,fortran,ada --enable-java-awt=gtk --disable-dssi --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-1.5.0.0/jre --enable-libgcj-multifile --enable-java-maintainer-mode --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --disable-libjava-multilib --with-ppl --with-cloog --with-tune=generic --with-arch_32=i686 --build=x86_64-redhat-linux 
Thread model: posix 
gcc version 4.4.7 20120313 (Red Hat 4.4.7-17) (GCC)

感谢您的任何建议！

罗伊

来源

2017-05-09 Roy Li

你的问题是什么？ – immibis

尝试禁用optimations，看看是否给出结果，当你打印总和：http://stackoverflow.com/questions/5765899/how-to-disable-compiler-optimizations-in-gcc –

一种选择是声明'总和'作为'挥发性'。 – paddy

考虑您的意见，即在打印终值减缓下来^（一），有一个相当不错的机会，优化器是搞清楚你是不是真正使用sum任何东西后你已经计算出来了，所以它优化了整个计算循环。

当我们测试我们大学收到的最新VAX 11/780机器（显示我的年龄）时，我实际上看到了类似的情况。由于完全相同的原因，它的速度提高了几千倍，新的优化编译器已经决定实际上不需要循环。

为了确定，您必须检查装配输出。我相信这可以用icc通过使用-Fa <asmFileName>选项，然后检查名称您用来代替<asmFileName>的文件来完成。

^（一）我想到了另一种可能性似乎这里打折扣。

这是由于i的范围是恒定的（基于N），并且计算否则涉及常量，因此编译器本身可能在编译时计算了最终值，从而导致简单恒定负载运行。

我见过gcc做这种事情在其-O3“疯狂”的优化级别。

我打折的可能性，因为值的印刷很可能不会影响此操作。

来源

2017-05-09 02:41:54 paxdiablo

谢谢你的回答，我试过-O1，-O2，-O3没有打印总和线，结果相同。如果完全关闭优化，使用-O0，循环被执行，所以我认为是的，答案应该是编译器优化整个循环。 –

大循环被intel编译器忽略了吗？

回答

相关问题