新闻中心

EEPW首页>嵌入式系统>设计应用> Arm2440——Nand flash启动模式详解(LED程序为例)

Arm2440——Nand flash启动模式详解(LED程序为例)

作者: 时间:2016-11-28 来源:网络 收藏
断断续续的研究arm也有2个月了,现在才感觉理解了arm在Nandflash模式下的启动过程,现在来这里记录下来以表达我无比喜悦的心情。闲话少说,趁着还没有忘记学习过程中的感受,直接进入正题。

大家都知道,arm在Nand flash启动模式下启动时系统会将Nand flash中的前4KB代码拷贝到SRAM(也就是Steppingstone中),由SRAM配置中断向量表和完成Nand flash访问的必要初始化,然后将Nand flash中的全部程序代码拷贝到SDRAM中,最后由SRAM跳转到SDRAM,然后程序就正常执行了,这一过程看上去很简单,但是真正理解这一过程还是不简单的,尽管这样,还是想告诉大家仔细理解还是比较容易理解这个过程的。如果您是ADS用户,你省去了很多麻烦,但我不确定你省去的这些麻烦是否值得,这里介绍的是一种麻烦的方式,linux下的led程序。

本文引用地址://m.amcfsurvey.com/article/201611/322798.htm

代码Head.s

  1. .externmain
  2. .text
  3. .global_start
  4. _start:
  5. breset
  6. reset:
  7. ldrsp,=4096
  8. bldisable_watch_dog
  9. blclock_init
  10. blmemsetup
  11. blcopy_steppingstone_to_sdram
  12. ldrpc,=on_sdram
  13. on_sdram:
  14. msrcpsr_c,#0xdf
  15. ldrsp,=0x34000000
  16. ldrlr,=halt_loop
  17. ldrpc,=Main
  18. halt_loop:
  19. bhalt_loop

我认为,最需要理解的就是这段代码了。先简单的解释下这段代码。

(1)由于arm执行reset之后pc会被清零,也就是reset中断的中断入口地址,因此,第一条指令就是b reset,跳转到reset中断处理函数。

(2)由于这里硬件配置都是C语言来完成的,而且我们的初始代码比较小,完全不会超出4KB,因此可以在SRAM使用堆栈,故将SP设置为4096,以提供C运行环境

(3)接下来的3个bl分别完成了关闭看门够定时器,配置时钟信号和存储器配置的工作,第四个bl是将SRAM的4KB空间内的代码拷贝到了SDRAM中。

(4)接下来的ldr句将pc赋值为on_sdram的地址,实现了从SRAM到SDRAM的跳转(下面会讲为什么)

(5)on_sdram中切换到了了系统模式然后分配了系统模式堆栈,将链接寄存器设置为halt_loop然后就跳转到了SDRAM中的Main

上面的解释只是大体上说明了代码的意思,但是初学者总会有个疑问就是为什么ldr pc,=on_sdram就实现了从SRAM到SDRAM的跳转呢?我被这个问题困扰了很长时间,到今天才想明白了这个问题,问题的关键就是相对跳转和绝对跳转的问题。为了说明这个问题我先解释一下bl指令跟ldr指令在执行过程中的区别。

B指令是相对跳转指令,B 指令是最简单的跳转指令。一旦遇到一个 B 指令,ARM 处理器将立即跳转到给定的目标地址,从那里继续执行。注意存储在跳转指令中的实际值是相对当前PC 值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算(参考寻址方式中的相对寻址)。它是 24 位有符号数,左移两位后有符号扩展为 32 位,表示的有效偏移为 26 位(前后32MB 的地址空间),同样的,BL、BX都是相对跳转。

LDR伪指令是将第二操作直接赋值给第一操作数,当执行ldr pc,=Main时是将Main的绝对地址赋值给了PC。

好了,知道这两个指令的区别之后我们来看代码是如何实现的从SRAM到SDRAM的跳转,首先需要指出,2440的开发板有SRAM和SDRAM,SRAM是从地址0x00000000开始的4KB内存空间,SDRAM是从0x30000000开始的64M空间。

无论用ADS编译还是用arm-linux-gcc编译都会将代码链接到0x30000000以后(也就是SDRAM中),ADS用户可以通过查看ADS的工程配置,其中有项配置是RO起始地址是0x30000000,linux用户在链接时需要用-T指定代码的其实地址为0x30000000。

根据编译原理,在链接阶段程序中函数的地址就已经确定了,也就是说函数的实际地址都在0x30000000之后,而程序的入口函数也就是这里的_start的地址就是0x300000000,其他函数都会大于这个数。

但是由于arm上电后系统会将Nand flash的前4KB代码拷贝到SRAM中,也就是_start函数开始的4KB指令将被拷贝到SRAM中执行,根据上例,在0x00000000处执行的指令就是“b reset”,由于b是相对跳转,是在当前pc值的基础上加减某个数而跳转到将要执行的代码处,因此,pc加减该数之后将到达reset函数的位置,故reset函数不能写到4KB之外的空间中,否则arm的启动将会失败,同样的,接下来的几个bl都是执行的相对跳转,所以都相对当前pc进行的跳转,由于Nand flash总共只有64M的空间,所以相对跳转是不可能会跳转到SDRAM的,因为跳转到SDRAM至少要发生0x30000000的跳转,而这个相对位移远远大于64M。

而ldr pc,=Main是将Main函数的实际地址赋值给pc,而Main的实际地址是在0x30000000之后,这样,就从SRAM跳转到了SDRAM。

由于这个过程设计到了硬件格局和编译原理,所以对一般人来讲,理解起来确实比较困难,而且受本人水平限制,很多地方只能说是只可意会不可言传,如果误导了大家请大家谅解。当然如果看到这里还不能理解arm的启动过程可以留言讨论这个问题。下面是相关的其他代码,我附在这里,2440addr.h没有贴出,由于我也是使用arm自带示例程序中的代码,而且代码有四千多行,多数地址是没有用到的。其他的代码如下

代码Init.s
  1. #include"2440addr.h"
  2. voiddisable_watch_dog(void);
  3. voidclock_init(void);
  4. voidmemsetup(void);
  5. voidcopy_steppingstone_to_sdram(void);
  6. voidinituart(void);
  7. voiddisable_watch_dog(void)
  8. {
  9. rWTCON=0;
  10. }
  11. voidclock_init(void)
  12. {
  13. rCLKDIVN=0x03;
  14. /*
  15. *如果HDIVN非0,CPU的总线模式应该从
  16. *“fastbusmode”变为“asynchronous
  17. *busmode”
  18. */
  19. __asm__(
  20. "mrcp15,0,r1,c1,c0,0"
  21. "orrr1,r1,#0xc0000000"
  22. "mcrp15,0,r1,c1,c0,0"
  23. );
  24. rMPLLCON=(92<<12)|(1<<4)|(2);
  25. //rMPLLCON=((0x5c<<12)|(0x01<<4)|(0x02));
  26. }
  27. voidmemsetup(void)
  28. {
  29. volatileunsignedlong*p=(volatileunsignedlong*)0x48000000;
  30. /*这个函数之所以这样赋值,而不是像前面的实验(比如mmu实验)那样将配置值
  31. *写在数组中,是因为要生成”位置无关的代码”,使得这个函数可以在被复制到
  32. *SDRAM之前就可以在steppingstone中运行
  33. */
  34. /*存储控制器13个寄存器的值*/
  35. p[0]=0x22011110;//BWSCON
  36. p[1]=0x00000700;//BANKCON0
  37. p[2]=0x00000700;//BANKCON1
  38. p[3]=0x00000700;//BANKCON2
  39. p[4]=0x00000700;//BANKCON3
  40. p[5]=0x00000700;//BANKCON4
  41. p[6]=0x00000700;//BANKCON5
  42. p[7]=0x00018005;//BANKCON6
  43. p[8]=0x00018005;//BANKCON7
  44. /*REFRESH,
  45. *HCLK=12MHz:0x008C07A3,
  46. *HCLK=100MHz:0x008C04F4
  47. */
  48. p[9]=0x008C04F4;
  49. p[10]=0x000000B1;//BANKSIZE
  50. p[11]=0x00000030;//MRSRB6
  51. p[12]=0x00000030;//MRSRB7
  52. }
  53. voidcopy_steppingstone_to_sdram(void)
  54. {
  55. unsignedint*pdwSrc=(unsignedint*)0;
  56. unsignedint*pdwDest=(unsignedint*)0x30000000;
  57. while(pdwSrc<(unsignedint*)4096)
  58. {
  59. *pdwDest=*pdwSrc;
  60. pdwDest++;
  61. pdwSrc++;
  62. }
  63. }
注意:由于我们的代码比较小,远小于4KB,因此arm启动时自动拷贝到SRAM中的4KB代码包含我们的全部代码,因此copy操作我是将stepingstone中的4KB代码拷贝到了SDRAM中,在实际应用中代码多数是超过4KB,因此copy函数应该是将Nand flash中的全部代码拷贝到SDRAM,这样才能成功运行ARM。

代码Main.c:

  1. #include"2440addr.h"
  2. voidDelay(inti)
  3. {
  4. intm,n,p;
  5. for(m=0;m!=i;++m)
  6. {
  7. for(n=0;n!=255;++n)
  8. {
  9. for(p=0;p!=255;++p)
  10. ;
  11. }
  12. }
  13. }
  14. voidMain()
  15. {
  16. intcount;
  17. intleds[4]={0x1c0,0x1a0,0x160,0xe0};
  18. rGPBCON=0x00155555;
  19. rGPBUP=rGPBUP&0xFF00;
  20. while(1)
  21. {
  22. for(count=0;count!=4;++count)
  23. {
  24. rGPBDAT=leds[count];
  25. if(count%2)
  26. rGPBDAT+=1;
  27. Delay(2);
  28. }
  29. }
  30. }

链接文件led.lds如下:
  1. SECTIONS
  2. {
  3. .=0x30000000;
  4. .text:{*(.text)}
  5. .rodataALIGN(4):{*(.rodata)}
  6. .dataALIGN(4):{*(.data)}
  7. .bssALIGN(4):{*(.bss)*(COMMON)}
  8. }

makefile如下:
  1. objects:=Head.oInit.oMain.o
  2. led.bin:$(objects)
  3. arm-linux-ld-Tled.lds-nostdlib-oled_elf$^
  4. arm-linux-objcopy-Obinary-Sled_elf$@
  5. arm-linux-objdump-D-marmled_elf>led.dis
  6. %.o:%.c
  7. arm-linux-gcc-Wall-O2-c-o$@$<
  8. %.o:%.s
  9. arm-linux-gcc-Wall-O2-c-o$@$<;
  10. .PYTHON:clean
  11. clean:
  12. rm-fled.binled_elfled.dis*.o

如上除了2440addr.h之外就都全了,另外需要指出的是2440addr.h中引用了Option.h,为了简化代码,可以将这句可以注释掉,在我们这段代码中完全用不到该文件相关功能。否则需要自行修改makefile文件完成Option.h相关的编译和链接工作。

好了,又浪费了大家这么长的时间,这里就不多说了,有什么问题求高手指出来。



评论


技术专区

关闭