关于contex-a9优化的疑问,请教各位前辈。
目前,需要在MTK的一款开发板上进行优化工作,它上面搭载的是android系统。CPU是contex-a9,支持vfp、vfpv3、vfpv3-d16等。这里有一些疑问,针对一些浮点数运算的优化,如下:a=1.225;
b=2.775;
c= 0;
for(k=0;k<50000;k++){
c += a*b;
}
汇编优化(my_arm_add(1.225,2.775)):
vmov s0,r0
vmov s1,r1
ldr r6, =0xc350
L1:
fmacs s4,s1,s0//vfp指令,浮点运算在vfp单元执行
sub r6,r6,#1
cmp r6,#0
bgt L1
vmov r0,s4
它们所消耗的时间基本上是一致的,并没有什么提升。这个过程中vfp这个协处理器能够提速么?