代码优化试验——短循环优化(下)

类别:VC语言 点击:0 评论:0 推荐:
测试程序2

#include <iostream.h>

#include <Timer.h>

void sum4()

{

       int j = 0;

       for (unsigned i = 1; i < 630001;)

       {

              j += i++;

              j += i++;

              j += i++;

              j += i++;

       }

}

 

void sum5()

{

       int j = 0;

       for (unsigned i = 1; i < 630001;)

       {

              j += i++;

              j += i++;

              j += i++;

              j += i++;

              j += i++;

       }

}

int main()

{

       int i, j; Timer timer;

       timer.Start();

       for (i = 0; i < 5; i++) sum4();

       cout << "sum4  : " << timer.GetTime() << endl;

       timer.Start();

       sum4();sum4();sum4();sum4();sum4();

       cout << "sum4E : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 5; i++) sum5();

       cout << "sum5  : " << timer.GetTime() << endl;

       timer.Start();

       sum5();sum5();sum5();sum5();sum5();

       cout << "sum5E : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 100; i++) sum4();

       cout << "sum4H : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 100; i++) sum5();

       cout << "sum5H : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

              for (j = 0; j < 5; j++) sum4();

       cout << "sum4T : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

       {sum4();sum4();sum4();sum4();sum4();}

       cout << "sum4TE: " << timer.GetTime() << endl;

       for (i = 0; i < 1000; i++)

              for (j = 0; j < 5; j++) sum5();

       cout << "sum5T : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

       {sum5();sum5();sum5();sum5();sum5();}

       cout << "sum5TE: " << timer.GetTime() << endl;

       return 0;

}

测试结果2

Sum4

Sum4E

Sum5

Sum5E

Sum4H

Sum5H

Sum4T

Sum4TE

Sum5T

Sum5TE

VC6 Release,生成文件大小57,344B,以下时间单位ms

8.781

8.45918

7.54705

7.54677

174.909

152.656

8672.62

8794.3

16433.9

7633.09

BCC32,生成文件大小140,800B,以下时间单位ms

8.5874

8.91789

8.61534

7.64287

169.769

180.58

8548.64

8758.32

17586.1

7835.57

这个表是个大致趋势,更多的数据我就不列了。这个结果颇出乎我的预料,变化很不规律,我得出以下结论,还望大家商榷:

1.         如果是单层循环,短循环不需要展开,性能提升不明显。对于BCC32,更不需要展开,由于编译器的优化,展开后还不如原来的。但是对于原来就很高效的,BCC32展开还是能带来提升的。

2.         对于不能展开的单层短循环,VC6和循环体内的函数性能一致,BCC32由于有优化,结果出现了倒退。

3.         对于多层循环的内循环短循环,如果原来函数的性能不是很好,展开的效果并不明显,这里是出现了倒退。最奇怪的是原来性能最好的sum5,在不展开的情况下居然性能那么差,展开后竟又是性能最好的了,提高了一倍多,真是怪事。

综上,对于原来性能好的函数,短循环展开能提升性能;如果你对自己的代码没信心,就不要展开了,有时会适得其反。

本文地址:http://com.8s8s.com/it/it1611.htm