高效的C编程之:C编译器及其优化
3.指令重排
当指定编译器对程序代码进行优化时,编译器会对程序中排列不合理的汇编指令序列进行重排(只有在-O1及其以上的优化级别中才有),重排的目的是为了减少指令互锁(interload)。所谓互锁就是指如果一条指令需要前一条指令的执行结果,而这时结果还没有出来,那么处理器就会等待。这被称为流水线冒险(pipelinehazard),也被称为流水线互锁。
下面例子显示了对同一程序使用代码重排和不使用代码重排所产生的汇编码的区别。÷
程序的源代码如下所示。
intf(int*p,intx)
{return*p+x*3;}
使用-O0选项对代码进行编译(无代码重排),产生的结果如下所示。
ADDr1,r1,r1,LSL#1
LDRr0,[r0,#0]
ADDr0,r0,r1 ;ARM9上产生互锁
MOVpc,lr
使用-O1选项对代码进行编译(存在代码重排),产生的结果如下所示。
ADDr1,r1,r1,LSL#1
ADDr0,r0,r1
MOVpc,lr
指令重排发生在寄存器定位和代码产生阶段。代码重排只对ARM9及其以后的处理器版本产生作用。当使用代码重排时,代码的执行速度平均提供4%。可以使用-zpno_optimize_
scheduling编译选项关闭代码重排。
4.内嵌函数
通常情况下,如果不指定编译选项,编译器会将一些代码量小且调用次数少的函数内嵌进调用函数中。如果某段子程序在其他模块中没有被调用,请使用Static关键字将其标识。
编译选项的--autoinline和--no_autoinline可以作为内嵌函数的使能开关。--no_autoinline选项为-O0和-O1选项的默认选项,但如果指定-O2或-O3的优化选项,编译器将默认使用--autoinline选项。
有关内嵌函数的详细信息,请参见本书内嵌函数一节。
下面的例子显示了同一段程序,使用内嵌功能和不使用内嵌功能编译出的不同结果。
要编译的源文件如下。
intbar(inta)
{
a=a+5;
returna;
}
intfoo(inti)
{
i=bar(i);
i=i-2;
i=bar(i);
i++;
returni;
}
下面的汇编程序为不使用内嵌功能时编译出的结果。
bar
ADDr0,r0,#5
MOVpc,lr
foo
STRlr,[sp,#-4]!
BLbar
SUBr0,r0,#2
BLbar
ADDr0,r0,#1
LDRpc,[sp],#4
下面的汇编码是使用内嵌功能时编译出的结果。
foo
ADDr0,r0,#5
SUBr0,r0,#2
ADDr0,r0,#5
ADDr0,r0,#1
MOVpc,lr
从上面的例子可以看出在使用内嵌功能时,函数间的相互调用减少了数据的压栈和出栈,节省了程序的执行时间,但如果内嵌函数被调用多次会造成空间的浪费。
c语言相关文章:c语言教程
评论