这是“算法”,但是当我要测量执行时间时,它给了我零。为什么?
#define ARRAY_SIZE 10000 ... clock_t start, end; start = clock(); for( i = 0; i < ARRAY_SIZE; i++) { non_parallel[i] = vec[i] * vec[i]; } end = clock(); printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );
那么我该如何测量时间呢?
两件事情:
10000在现代计算机上不是很多。因此,该循环的运行时间可能不到一毫秒-小于的精度clock()。因此它将返回零。
10000
clock()
如果没有使用它的结果,non_parallel编译器会优化整个循环。
non_parallel
最有可能的是,您只需要一个更昂贵的循环。尝试增加到ARRAY_SIZE更大。
ARRAY_SIZE
这是在我的机器上具有更大阵列大小的测试:
#define ARRAY_SIZE 100000000 int main(){ clock_t start, end; double *non_parallel = (double*)malloc(ARRAY_SIZE * sizeof(double)); double *vec = (double*)malloc(ARRAY_SIZE * sizeof(double)); start = clock(); for(int i = 0; i < ARRAY_SIZE; i++) { non_parallel[i] = vec[i] * vec[i]; } end = clock(); printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC ); free(non_parallel); free(vec); return 0; }
输出:
Number of seconds: 0.446000