高效的C编程之:C编译器及其优化
如果不生成调试表,这是默认优化级别。
·-O3:最高优化级别。使用该优化级别,使生成的代码在时间和空间上寻求平衡。该选项常和-Ospace和-Otime配合使用。
·-O3–Otime:使用该选项编译的代码比-O2–Otime选项编译的代码,在执行速度上要快,但占用的空间也更大。
·-O3-Ospace:产生的代码比使用-O2-Ospace选项产生的代码尺寸小,但执行效率可能会差。
如果要使编译的代码更侧重于代码的尺寸或执行效率(两者往往不可兼得),可以使用下面的编译选项。
·-Ospace:指示编译程序执行优化,以延长执行时间为代价减小映像大小。例如,由外部函数调用代替内联函数。如果代码大小比性能更重要,则使用该选项。这是编译器的默认设置。
·-Otime:指示编译程序执行优化,以增大映像大小为代价缩短执行时间。如果执行时间比代码大小更重要,则使用该选项。例如,它编译:
while(expression)body;
为:
if(expression){
dobody;
while(expression);
}
如果既不指定-Otime也不指定-Ospace,则编译器默认使用-Ospace。可使用-Otime编译代码中对时间要求严格的部分,使用-Ospace编译其余部分。但不能在同一编译程序调用中同时指定-Otime和-Ospace。
14.1.4AAPCS选项
ARM结构过程调用标准AAPCS(ProcedureCallStandardfortheARMArchitecture)是ARM体系结构二进制接口ABI(ApplicationBinaryInterfacefortheARMArchitecture【BSABI】)标准的一部分。使用该标准可以很方便的执行C和汇编语言的相互调用。
编译程序时,使用--apcs选项可以指定所使用得AAPCS标准的版本。如果没有指定--apcs或--cpu选项,则编译器使用下面默认编译选项。
--apcs/noswst/nointer/noropi/norwpi--cpuARM7TDMI--fpusoftvfp
有关AAPCS的详细信息,请参加ARM相关文档。
14.1.5编译选项对代码生成影响示例
本节举例说明编译器的优化选项如何影响代码生成。
1.使用-O0选项
下面的例子显示了即使使用-O0编译选项对代码进行编译时,有些冗余代码还是会被编译器自动清除。
intf(int*p)
{
return(*p==*p);
}
使用armcc-c-O0对源程序进行编译,生成的汇编代码如下所示。
f
MOVr1,r0
MOVr0,#1
MOVpc,lr
通过上面的例子可以看到,编译出的最终代码中没有加载(Load)指针P的值,变量*p被编译器优化掉了。如果不想让编译器对变量*p做优化,可以使用“volatile”对变量进行声明。下面的例子,显示了将变量声明为“volatile”类型后,使用armcc编译(-O2的优化级别)后的结果。
f
LDRr1,[r0]
LDRr0,[r0]
CMPr1,r0
MOVNEr0,#0
MOVEQr0,#1
MOVpc,lr
另外,编译的代码中的“MOVr1,r0”并没有实际意义,只是为了方便调试程序时设置断点使用。
2.冗余代码的清除
下面例子显示了一段急待优化的代码。
intdummy()
{
inta=10,b=20;
intc;
c=a+b;
return0;
}
当使用arm–c–O0进行编译时,产生的汇编码如下所示。
dummy:
0000807CE3A0100AMOV r1,#0xa
>>>REDUNDANT#3inta=10,b=20;
00008080E3A02014MOV r2,#0x14
>>>REDUNDANT#5c=a+b;
00008084E0813002ADD r3,r1,r2
>>>REDUNDANT#6return0;
00008088E3A00000MOV r0,#0
>>>REDUNDANT#7}
0000808CE12FFF1EBX r14
从上面的汇编输出可以看到,编译器并没有对程序中的冗余变量做任何工作。但上面这段代码在编译时,编译器会给出警告,警告信息如下所示。
Warning:#550-D:variablecwassetbutneverused
Redundant.cline4intc;
但如果将编译器的优化级别提高,如使用arm–c–O1命令,则编译器输出的汇编代码如下所示。
dummy:
0000807CE3A00000MOVr0,#0
>>>REDUNDANT#7}
00008080E12FFF1EBXr14
从上面的例子看出,当优化级别提高到-O1时,程序中的冗余变量就会被清除。
c语言相关文章:c语言教程
评论