1.2 ARM汇编语言_嵌入式系统开发-QQ阅读男生玄幻网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

1.2 ARM汇编语言

要进入嵌入式开发领域，对于某种嵌入式处理平台的汇编语言也是需要了解的，特别是在编写一些和硬件“打交道”比较多的底层程序的时候，更是需要使用汇编语言来提高效率。本节将对ARM系统的汇编语言做一个基本的介绍，由于讲述ARM汇编需要有一定的ARM处理器结构方面的知识，没有相关基础的读者可以提前去阅读本书4.4节的内容。

1.2.1 学习方法介绍

在讲解ARM汇编之前，先说明一下学习这种语言的基本方法。初学ARM汇编并不需要把每条汇编指令都搞清楚，只需要掌握最基本的、最常用的几条指令。然后可以找一些关于ARM汇编的手册，以后碰到读不懂的指令马上查找即可。不要在初学ARM时，花太多时间在学习汇编指令上面。ARM汇编的应用多集中在ARM接口编程及bootloader，如uboot的移植和修改。再往后到操作系统层面上基本上涉及到ARM汇编的内容相对较少，只有阅读驱动程序时可能会碰到。

另外需要注意的是ARM汇编分为ARM公司的标准ARM汇编语言和GNU对ARM支持的GNU ARM汇编。ARM标准汇编语言即通常使用的ARM公司的开发工具ADS里用的汇编语言。GNU汇编即在Linux下用GCC编译器进行编译的汇编，两者语法有少许差异。因此，通常下载的Linux下的ARM接口代码放到ADS下是不能编译通过的，需要进行少许修改，这一点在以后学习ARM接口代码编程时要特别注意。

1.2.2 ARM微处理器的指令的分类与格式

ARM微处理器的指令集是加载/存储型的，即指令集仅能处理寄存器中的数据，而且处理结果都要放回寄存器中，而对系统存储器的访问则需要通过专门的加载/存储指令来完成。ARM微处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器（PSR）处理指令、加载/存储指令、协处理器指令和异常产生指令六大类，具体的指令及功能如表1-1所示（表中指令为基本ARM指令，不包括派生的ARM指令）

表1-1 ARM的具体指令及功能

1.2.3 指令的条件域

当处理器工作在ARM状态时，几乎所有的指令均根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行条件满足时，指令被执行，否则指令被忽略。

每一条ARM指令包含4位的条件码，位于指令的最高4位[31：28]。条件码共有16种，每种条件码可用两个字符表示，这两个字符可以添加在指令助记符的后面和指令同时使用。例如，跳转指令B可以加上后缀EQ变为BEQ表示“相等则跳转”，即当CPSR中的Z标志置位时发生跳转。在16种条件标志码中，只有15种可以使用，如表1-2所示，第16种（1111）为系统保留，暂时不能使用。

表1-2 ARM指令的代码

1.2.4 指令的寻址方式

所谓寻址方式就是处理器根据指令中给出的地址信息来寻找物理地址的方式。目前ARM指令系统支持如下几种常见的寻址方式。

1. 立即寻址

立即寻址也叫立即数寻址，这是一种特殊的寻址方式，操作数本身就在指令中给出，只要取出指令也就取到了操作数。这个操作数被称为立即数，对应的寻址方式也就叫做立即寻址。例如以下指令：

      ADD R0，R0，#1 ；R0←R0+1
      ADD R0，R0，#0x3f ；R0←R0+0x3f

在以上两条指令中，第二个源操作数即为立即数，要求以“#”为前缀，对于以十六进制表示的立即数，还要求在“#”后加上“0x”或“&”。

2. 寄存器寻址

寄存器寻址就是利用寄存器中的数值作为操作数，这种寻址方式是各类微处理器经常采用的一种方式，也是一种执行效率较高的寻址方式。以下指令：

      ADD R0，R1，R2 ；R0←R1+R2

该指令的执行效果是将寄存器R1和R2的内容相加，其结果存放在寄存器R0中。

3. 寄存器间接寻址

寄存器间接寻址就是以寄存器中的值作为操作数的地址，而操作数本身存放在存储器中。例如以下指令：

      ADD R0，R1，[R2] ；R0←R1+[R2]
      LDR R0，[R1] ；R0←[R1]
      STR R0，[R1] ；[R1]←R0

在第一条指令中，以寄存器R2的值作为操作数的地址，在存储器中取得一个操作数后与R1相加，结果存入寄存器R0中。第二条指令将以R1的值为地址的存储器中的数据传送到R0中。第三条指令将R0的值传送到以R1的值为地址的存储器中。

4. 基址变址寻址

基址变址寻址就是将寄存器（该寄存器一般称做基址寄存器）的内容与指令中给出的地址偏移量相加，从而得到一个操作数的有效地址。基址变址寻址方式常用于访问某基地址附近的地址单元。采用基址变址寻址方式的指令常见有以下几种形式，如下所示：

      LDR R0，[R1，#4] ；R0←[R1+4]
      LDR R0，[R1，#4]！ ；R0←[R1+4]、R1←R1+4
      LDR R0，[R1] ，#4 ；R0←[R1]、R1←R1+4
      LDR R0，[R1，R2] ；R0←[R1+R2]

在第一条指令中，将寄存器R1的内容加上4形成操作数的有效地址，从而取得操作数存入寄存器R0中。在第二条指令中，将寄存器R1的内容加上4形成操作数的有效地址，从而取得操作数存入寄存器R0中，然后R1的内容自增4个字节。在第三条指令中，以寄存器R1的内容作为操作数的有效地址，从而取得操作数存入寄存器R0中，然后，R1的内容自增4个字节。在第四条指令中，将寄存器R1的内容加上寄存器R2的内容形成操作数的有效地址，从而取得操作数存入寄存器R0中。

5. 多寄存器寻址

采用多寄存器寻址方式，一条指令可以完成多个寄存器值的传送。这种寻址方式可以用一条指令完成传送最多16个通用寄存器的值。以下指令：

      LDMIA R0，{R1，R2，R3，R4} ；R1←[R0]
      ；R2←[R0+4]
      ；R3←[R0+8]
      ；R4←[R0+12]

该指令的后缀IA表示在每次执行完加载/存储操作后，R0按字长度增加，因此指令可将连续存储单元的值传送到R1～R4。

6. 相对寻址

与基址变址寻址方式相类似，相对寻址以程序计数器PC的当前值为基地址，指令中的地址标号作为偏移量，将两者相加之后得到操作数的有效地址。以下程序段完成子程序的调用和返回，跳转指令BL采用了相对寻址方式：

      BL NEXT ；跳转到子程序NEXT 处执行
      ……
      NEXT
      ……
      MOV PC，LR ；从子程序返回

7. 堆栈寻址

堆栈是一种数据结构，按先进后出（First In Last Out，FILO）的方式工作，使用一个称做堆栈指针的专用寄存器指示当前的操作位置，堆栈指针总是指向栈顶。当堆栈指针指向最后压入堆栈的数据时，称为满堆栈（Full Stack），而当堆栈指针指向下一个将要放入数据的空位置时，称为空堆栈（Empty Stack）。同时，根据堆栈的生成方式，又可以分为递增堆栈（Ascending Stack）和递减堆栈（Decending Stack），当堆栈由低地址向高地址生成时，称为递增堆栈，当堆栈由高地址向低地址生成时，称为递减堆栈。这样就有4种类型的堆栈工作方式，ARM微处理器支持这4种类型的堆栈工作方式，即：

满递增堆栈：堆栈指针指向最后压入的数据，且由低地址向高地址生成。

满递减堆栈：堆栈指针指向最后压入的数据，且由高地址向低地址生成。

空递增堆栈：堆栈指针指向下一个将要放入数据的空位置，且由低地址向高地址生成。

空递减堆栈：堆栈指针指向下一个将要放入数据的空位置，且由高地址向低地址生成。

1.2.5 ARM汇编的指令分类讲解及示例

1. 跳转指令

跳转指令用于实现程序流程的跳转，在ARM程序中有两种方法可以实现程序流程的跳转：

— 使用专门的跳转指令。

— 直接向程序计数器PC写入跳转地址值。

通过向程序计数器PC写入跳转地址值，可以实现在4 GB的地址空间中任意跳转，在跳转之前结合使用MOV LR，PC等类似指令，可以保存将来的返回地址值，从而实现在4 GB连续的线性地址空间的子程序调用。ARM指令集中的跳转指令可以完成从当前指令向前或向后的32 MB的地址空间的跳转，包括以下4条指令：

— B跳转指令。

— BL带返回的跳转指令。

— BLX带返回和状态切换的跳转指令。

— BX带状态切换的跳转指令。

B指令

      B指令的格式为：B{条件} 目标地址

B指令是最简单的跳转指令。一旦遇到一个B指令，ARM处理器将立即跳转到给定的目标地址，从那里继续执行。注意存储在跳转指令中的实际值是相对当前PC值的一个偏移量，而不是一个绝对地址，它的值由汇编器来计算（参考寻址方式中的相对寻址）。它是24位有符号数，左移两位后有符号扩展为32位，表示的有效偏移为26位（前后32MB的地址空间）。以下指令：

      B Label ；程序无条件跳转到标号Label 处执行
      CMP R1，#0 ；当CPSR 寄存器中的Z 条件码置位时，程序跳转到标号Label 处执行
      BEQ Label

BL指令

      BL指令的格式为：BL{条件} 目标地址

BL是另一个跳转指令，但跳转之前，会在寄存器R14中保存PC的当前内容，因此，可以通过将R14的内容重新加载到PC中，来返回到跳转指令之后的那个指令处执行。该指令是实现子程序调用的一个常用的手段。以下指令：

      BL Label ；当程序无条件跳转到标号Label 处执行时，同时将当前的PC 值保存到R14中

BLX指令

      BLX指令的格式为：BLX 目标地址

BLX指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态由ARM状态切换到Thumb状态，该指令同时将PC的当前内容保存到寄存器R14中。因此，当子程序使用Thumb指令集，而调用者使用ARM指令集时，可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时，子程序的返回可以通过将寄存器R14值复制到PC中来完成。

BX指令

      BX指令的格式为：BX{条件} 目标地址

BX指令跳转到指令中所指定的目标地址，目标地址处的指令既可以是ARM指令，也可以是Thumb指令。

2. 数据处理指令

数据处理指令可分为数据传送指令、算术逻辑运算指令和比较指令等。数据传送指令用于在寄存器和存储器之间进行数据的双向传输。算术逻辑运算指令完成常用的算术与逻辑的运算，该类指令不但将运算结果保存在目的寄存器中，同时更新CPSR中的相应条件标志位。比较指令不保存运算结果，只更新CPSR中相应的条件标志位。数据处理指令包括：

— MOV数据传送指令。

— MVN数据取反传送指令。

— CMP比较指令。

— CMN反值比较指令。

— TST位测试指令。

— TEQ相等测试指令。

— ADD加法指令。

— ADC带进位加法指令。

— SUB减法指令。

— SBC带借位减法指令。

— RSB逆向减法指令。

— RSC带借位的逆向减法指令。

— AND逻辑与指令。

— ORR逻辑或指令。

— EOR逻辑异或指令。

— BIC位清除指令。

MOV指令

      MOV指令的格式为：MOV{条件}{S} 目的寄存器，源操作数

MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。其中S选项决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。指令示例：

      MOV R1，R0 ；将寄存器R0的值传送到寄存器R1
      MOV PC，R14 ；将寄存器R14的值传送到PC，常用于子程序返回
      MOV R1，R0，LSL#3 ；将寄存器R0的值左移3位后传送到R1

MVN指令

      MVN指令的格式为：MVN{条件}{S} 目的寄存器，源操作数

MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了，即把一个被取反的值传送到目的寄存器中。其中S决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。指令示例：

      MVN R0，#0 ；将立即数0 取反传送到寄存器R0中，完成后R0=-1

CMP指令

      CMP指令的格式为：CMP{条件} 操作数1，操作数2

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，同时更新CPSR中条件标志位的值。该指令进行一次减法运算，但不存储结果，只更改条件标志位。标志位表示的是操作数1与操作数2的关系（大、小、相等），例如，当操作数1大于操作数2，则此后的有GT后缀的指令将可以执行。指令示例：

      CMP R1，R0 ；将寄存器R1的值与寄存器R0的值相减，并根据结果设置CPSR的标志位
      CMP R1，#100 ；将寄存器R1的值与立即数100 相减，并根据结果设置CPSR的标志位

CMN指令

      CMN指令的格式为：CMN{条件} 操作数1，操作数2

CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较，同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相加，并根据结果更改条件标志位。指令示例：

      CMN R1，R0 ；将寄存器R1的值与寄存器R0的值相加，并根据结果设置CPSR的标志位
      CMN R1，#100 ；将寄存器R1的值与立即数100 相加，并根据结果设置CPSR的标志位

TST指令

      TST指令的格式为：TST{条件} 操作数1，操作数2

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算，并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据，而操作数2是一个位掩码，该指令一般用来检测是否设置了特定的位。指令示例：

      TST R1，#%1 ；用于测试在寄存器R1中是否设置了最低位（%表示二进制数）
      TST R1，#0xffe ；将寄存器R1的值与立即数0xffe 按位与，并根据结果设置CPSR的标志位

TEQ指令

      TEQ指令的格式为：TEQ{条件} 操作数1，操作数2

TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算，并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。指令示例：

      TEQ R1，R2 ；将寄存器R1的值与寄存器R2的值按位异或，并根据结果设置CPSR的标志位

ADD指令

      ADD指令的格式为：ADD{条件}{S} 目的寄存器，操作数1，操作数2

ADD指令用于把两个操作数相加，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。指令示例：

      ADD R0，R1，R2 ； R0 = R1 + R2

      ADD R0，R1，#256 ； R0 = R1 + 256
      ADD R0，R2，R3，LSL#1 ； R0 = R2 + (R3 << 1)

ADC指令

      ADC指令的格式为：ADC{条件}{S} 目的寄存器，操作数1，操作数2

ADC指令用于把两个操作数相加，再加上CPSR中的C条件标志位的值，并将结果存放到目的寄存器中。它使用一个进位标志位，这样就可以做比32位大的数的加法，注意不要忘记设置S后缀来更改进位标志。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。以下指令序列完成两个128位数的加法，第一个数由高到低存放在寄存器R7～R4，第二个数由高到低存放在寄存器R11～R8，运算结果由高到低存放在寄存器R3～R0：

      ADDS R0，R4，R8 ； 加低端的字
      ADCS R1，R5，R9 ； 加第二个字，带进位
      ADCS R2，R6，R10 ； 加第三个字，带进位
      ADC R3，R7，R11 ； 加第四个字，带进位

SUB指令

      SUB指令的格式为： SUB{条件}{S} 目的寄存器，操作数1，操作数2

SUB指令用于把操作数1减去操作数2，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。指令示例：

      SUB R0，R1，R2 ； R0 = R1 - R2
      SUB R0，R1，#256 ； R0 = R1 - 256
      SUB R0，R2，R3，LSL#1 ； R0 = R2 - (R3 << 1)

SBC指令

      SBC指令的格式为：SBC{条件}{S} 目的寄存器，操作数1，操作数2

SBC指令用于把操作数1减去操作数2，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法，注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。指令示例：

      SUBS R0，R1，R2 ； R0 = R1 - R2 - ！C，并根据结果设置CPSR的进位标志位

RSB指令

      RSB指令的格式为：RSB{条件}{S} 目的寄存器，操作数1，操作数2

RSB指令称为逆向减法指令，用于把操作数2减去操作数1，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。指令示例：

      RSB R0，R1，R2 ； R0 = R2 - R1
      RSB R0，R1，#256 ； R0 = 256 - R1
      RSB R0，R2，R3，LSL#1 ； R0 = (R3 << 1) - R2

RSC指令

      RSC指令的格式为：RSC{条件}{S} 目的寄存器，操作数1，操作数2

RSC指令用于把操作数2减去操作数1，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法，注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。指令示例：

      RSC R0，R1，R2 ； R0 = R2 - R1 - ！C

AND指令

      AND指令的格式为：AND{条件}{S} 目的寄存器，操作数1，操作数2

AND指令用于在两个操作数上进行逻辑与运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令常用于屏蔽操作数1的某些位。指令示例：

      AND R0，R0，#3 ； 该指令保持R0的0、1位，其余位清零。

ORR指令

      ORR指令的格式为：ORR{条件}{S} 目的寄存器，操作数1，操作数2

ORR指令用于在两个操作数上进行逻辑或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令常用于设置操作数1的某些位。指令示例：

      ORR R0，R0，#3 ； 该指令设置R0的0、1位，其余位保持不变。

EOR指令

      EOR指令的格式为：EOR{条件}{S} 目的寄存器，操作数1，操作数2

EOR指令用于在两个操作数上进行逻辑异或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。该指令常用于反转操作数1的某些位。指令示例：

      EOR R0，R0，#3 ； 该指令反转R0的0、1位，其余位保持不变。

BIC指令

      BIC指令的格式为：BIC{条件}{S} 目的寄存器，操作数1，操作数2

BIC指令用于清除操作数1的某些位，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，也可以是被移位的寄存器，或一个立即数。操作数2为32位的掩码，如果在掩码中设置了某一位，则清除这一位。未设置的掩码位保持不变。指令示例：

      BIC R0，R0，#%1011 ； 该指令清除 R0中的位0、1、和3，其余的位保持不变。

3. 乘法指令与乘加指令

ARM微处理器支持的乘法指令与乘加指令共有6条，可分为运算结果为32位和运算结果为64位两类，与前面的数据处理指令不同，指令中的所有操作数、目的寄存器必须为通用寄存器，不能对操作数使用立即数或被移位的寄存器。同时，目的寄存器和操作数1必须是不同的寄存器。

乘法指令与乘加指令共有以下6条：

— MUL 32位乘法指令。

— MLA 32位乘加指令。

— SMULL 64位有符号数乘法指令。

— SMLAL 64位有符号数乘加指令。

— UMULL 64位无符号数乘法指令。

— UMLAL 64位无符号数乘加指令。

MUL指令

      MUL指令的格式为：MUL{条件}{S} 目的寄存器，操作数1，操作数2

MUL指令完成将操作数1与操作数2的乘法运算，并把结果放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数或无符号数。指令示例：

      MUL R0，R1，R2 ；R0 = R1 × R2
      MULS R0，R1，R2 ；R0 = R1 × R2，同时设置CPSR中的相关条件标志位

MLA指令

      MLA指令的格式为：MLA{条件}{S} 目的寄存器，操作数1，操作数2，操作数3

MLA指令完成将操作数1与操作数2的乘法运算，再将乘积加上操作数3，并把结果放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数或无符号数。指令示例：

      MLA R0，R1，R2，R3 ；R0 = R1 × R2 + R3
      MLAS R0，R1，R2，R3 ；R0 = R1 × R2 + R3，同时设置CPSR中的相关条件标志位

SMULL指令

      SMULL指令格式为：SMULL{条件}{S} 目的寄存器Low，目的寄存器低High，操作数1，操作数2

SMULL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。指令示例：

      SMULL R0，R1，R2，R3 ；R0 = （R2 × R3）的低32位
      ；R1 = （R2 × R3）的高32位

SMLAL指令

      SMLAL指令格式为：SMLAL{条件}{S} 目的寄存器Low，目的寄存器低High，操作数1，操作数2

SMLAL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。

对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。指令示例：

      SMLAL R0，R1，R2，R3 ；R0 = （R2 × R3）的低32位 + R0
      ；R1 = （R2 × R3）的高32位 + R1

UMULL指令

      UMULL指令格式为：UMULL{条件}{S} 目的寄存器Low，目的寄存器低High，操作数1，操作数2

UMULL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。指令示例：

      UMULL R0，R1，R2，R3 ；R0 = （R2 × R3）的低32位
      ；R1 = （R2 × R3）的高32位

UMLAL指令

      UMLAL指令格式为：UMLAL{条件}{S} 目的寄存器Low，目的寄存器低High，操作数1，操作数2

UMLAL指令完成将操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。指令示例：

      UMLAL R0，R1，R2，R3 ；R0 = （R2 × R3）的低32位 + R0
      ；R1 = （R2 × R3）的高32位 + R1

4. 程序状态寄存器访问指令

ARM微处理器支持程序状态寄存器访问指令，用于在程序状态寄存器和通用寄存器之间传送数据，程序状态寄存器访问指令包括以下两条：

— MRS程序状态寄存器到通用寄存器的数据传送指令。

— MSR通用寄存器到程序状态寄存器的数据传送指令。

MRS指令

      MRS指令的格式为：MRS{条件} 通用寄存器，程序状态寄存器（CPSR 或SPSR）

MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下几种情况：

- 当需要改变程序状态寄存器的内容时，可用MRS将程序状态寄存器的内容读入通用寄存器，修改后再写回程序状态寄存器。

- 当在异常处理或进程切换时，需要保存程序状态寄存器的值，可先用该指令读出程序状态寄存器的值，然后保存。指令示例：

      MRS R0，CPSR ；传送CPSR的内容到R0
      MRS R0，SPSR ；传送SPSR的内容到R0

MSR指令

      MSR指令的格式为：MSR{条件} 程序状态寄存器（CPSR 或SPSR）_<域>，操作数

MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中，操作数可以为通用寄存器或立即数。<域>用于设置程序状态寄存器中需要操作的位，32位的程序状态寄存器可分为4个域：位[31：24]为条件标志位域，用f表示；位[23：16]为状态位域，用s表示；位[15：8]为扩展位域，用x表示；位[7：0]为控制位域，用c表示；

该指令通常用于恢复或改变程序状态寄存器的内容，在使用时，一般要在MSR指令中指明将要操作的域。指令示例：

      MSR CPSR，R0 ；传送R0的内容到CPSR
      MSR SPSR，R0 ；传送R0的内容到SPSR
      MSR CPSR_c，R0 ；传送R0的内容到SPSR，但仅仅修改CPSR中的控制位域

5. 加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据，加载指令用于将存储器中的数据传送到寄存器，存储指令则完成相反的操作。常用的加载存储指令如下：

— LDR字数据加载指令。

— LDRB字节数据加载指令。

— LDRH半字数据加载指令。

— STR字数据存储指令。

— STRB字节数据存储指令。

— STRH半字数据存储指令。

LDR指令

      LDR指令的格式为：LDR{条件} 目的寄存器，<存储器地址>

LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当做目的地址，从而可以实现程序流程的跳转。该指令在程序设计中比较常用，且寻址方式灵活多样，请读者认真掌握。指令示例：

      LDR R0，[R1] ；将存储器地址为R1的字数据读入寄存器R0。
      LDR R0，[R1，R2] ；将存储器地址为R1+R2的字数据读入寄存器R0。
      LDR R0，[R1，#8] ；将存储器地址为R1+8的字数据读入寄存器R0。
      LDR R0，[R1，R2]! ；将存储器地址为R1+R2的字数据读入寄存器R0，并将新地址R1
                          +R2 写入R1。
      LDR R0，[R1，#8]! ；将存储器地址为R1+8的字数据读入寄存器R0，并将新地址R1
                            +8 写入R1。
      LDR R0，[R1]，R2 ；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1+
                          R2 写入R1。
      LDR R0，[R1，R2，LSL#2]! ；将存储器地址为R1+R2×4的字数据读入寄存器R0，并将新地
                                  址R1+R2×4 写入R1。
      LDR R0，[R1]，R2，LSL#2 ；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1+
                                R2×4 写入R1。

LDRB指令

      LDRB指令的格式为：LDR{条件}B 目的寄存器，<存储器地址>

LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中，同时将寄存器的高24位清零。该指令通常用于从存储器中读取8位的字节数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当做目的地址，从而可以实现程序流程的跳转。指令示例：

      LDRB R0，[R1] ；将存储器地址为R1的字节数据读入寄存器R0，并将R0的高24位清零。
      LDRB R0，[R1，#8] ；将存储器地址为R1+8的字节数据读入寄存器R0，并将R0的高24位清零。

LDRH指令

      LDRH指令的格式为：LDR{条件}H 目的寄存器，<存储器地址>

LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中，同时将寄存器的高16位清零。该指令通常用于从存储器中读取16位的半字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当做目的地址，从而可以实现程序流程的跳转。指令示例：

      LDRH R0，[R1] ；将存储器地址为R1的半字数据读入寄存器R0，并将R0的高16位清零。
      LDRH R0，[R1，#8] ；将存储器地址为R1+8的半字数据读入寄存器R0，并将R0的高16位清零。
      LDRH R0，[R1，R2] ；将存储器地址为R1+R2的半字数据读入寄存器R0，并将R0的高16位清零。

STR指令

      STR指令的格式为：STR{条件} 源寄存器，<存储器地址>

STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。该指令在程序设计中比较常用，且寻址方式灵活多样，使用方式可参考指令LDR。指令示例：

      STR R0，[R1]，#8 ；将R0中的字数据写入以R1为地址的存储器中，并将新地址R1+8写入R1。
      STR R0，[R1，#8] ；将R0中的字数据写入以R1+8为地址的存储器中。

STRB指令

      STRB指令的格式为：STR{条件}B 源寄存器，<存储器地址>

STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。指令示例：

      STRB R0，[R1] ；将寄存器R0中的字节数据写入以R1为地址的存储器中。
      STRB R0，[R1，#8] ；将寄存器R0中的字节数据写入以R1+8为地址的存储器中。

STRH指令

      STRH指令的格式为：STR{条件}H 源寄存器，<存储器地址>

STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。指令示例：

      STRH R0，[R1] ；将寄存器R0中的半字数据写入以R1为地址的存储器中。
      STRH R0，[R1，#8] ；将寄存器R0中的半字数据写入以R1+8为地址的存储器中。

6. 批量数据加载/存储指令

ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据，批量加载指令用于将一片连续的存储器中的数据传送到多个寄存器，批量数据存储指令则完成相反的操作。常用的加载存储指令如下：

— LDM批量数据加载指令。

— STM批量数据存储指令。

LDM（或STM）指令

      LDM（或STM）指令的格式为：LDM（或STM）{条件}{类型}基址寄存器{！}，寄存器列表{∧}

LDM（或STM）指令用于由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据，该指令的常见用途是将多个寄存器的内容入栈或出栈。其中，{类型}为以下几种情况：

      IA 每次传送后地址加1；
      IB 每次传送前地址加1；
      DA 每次传送后地址减1；
      DB 每次传送前地址减1；
      FD 满递减堆栈；
      ED 空递减堆栈；
      FA 满递增堆栈；
      EA 空递增堆栈；

{！}为可选后缀，若选用该后缀，则当数据传送完毕之后，将最后的地址写入基址寄存器，否则基址寄存器的内容不改变。基址寄存器不允许为R15，寄存器列表可以为R0～R15的任意组合。{∧}为可选后缀，当指令为LDM且寄存器列表中包含R15，选用该后缀时表示：除了正常的数据传送之外，还将SPSR复制到CPSR。同时，该后缀还表示传入或传出的是用户模式下的寄存器，而不是当前模式下的寄存器。指令示例：

      STMFD R13!，{R0，R4-R12，LR} ；将寄存器列表中的寄存器（R0，R4 到R12，LR）存入堆栈。
      LDMFD R13!，{R0，R4-R12，PC} ；将堆栈内容恢复到寄存器（R0，R4 到R12，LR）。

7. 数据交换指令

ARM微处理器所支持数据交换指令能在存储器和寄存器之间交换数据。数据交换指令有如下两条：

— SWP字数据交换指令。

— SWPB字节数据交换指令。

SWP指令

      SWP指令的格式为：SWP{条件} 目的寄存器，源寄存器1，[源寄存器2]

SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中，同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。显然，当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。指令示例：

      SWP R0，R1，[R2] ；将R2所指向的存储器中的字数据传送到R0，同时将R1中的字数据传送到R2 所
  指向的存储单元。
      SWP R0，R0，[R1] ；该指令完成将R1 所指向的存储器中的字数据与R0中的字数据交换。

SWPB指令

      SWPB指令的格式为：SWP{条件}B 目的寄存器，源寄存器1，[源寄存器2]

SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中，目的寄存器的高24清零，同时将源寄存器1中的字节数据传送到源寄存器2所指向的存储器中。显然，当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。指令示例：

      SWPB R0，R1，[R2] ；将R2 所指向的存储器中的字节数据传送到R0，R0的高24位清零，同时将R1
  中的低8位数据传送到R2 所指向的存储单元。
      SWPB R0，R0，[R1] ；该指令完成将R1 所指向的存储器中的字节数据与R0中的低8位数据交换。

8. 移位指令

ARM微处理器内嵌的桶型移位器（Barrel Shifter），支持数据的各种移位操作，移位操作在ARM指令集中不作为单独的指令使用，它只能作为指令格式中是一个字段，在汇编语言中表示为指令中的选项。例如，数据处理指令的第二个操作数为寄存器时，就可以加入移位操作选项对它进行各种移位操作。移位操作包括如下6种类型，ASL和LSL是等价的，可以自由互换：

— LSL逻辑左移。

— ASL算术左移。

— LSR逻辑右移。

— ASR算术右移。

— ROR循环右移。

— RRX带扩展的循环右移。

LSL（或ASL）操作

      LSL（或ASL）操作的格式为：通用寄存器，LSL（或ASL） 操作数

LSL（或ASL）可完成对通用寄存器中的内容进行逻辑（或算术）的左移操作，按操作数所指定的数量向左移位，低位用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（0～31）。操作示例：

      MOV R0, R1, LSL#2 ；将R1中的内容左移两位后传送到R0中。

LSR操作

      LSR 操作的格式为：通用寄存器，LSR 操作数

LSR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（0～31）。操作示例：

      MOV R0, R1, LSR#2 ；将R1中的内容右移两位后传送到R0中，左端用零来填充。

ASR操作

      ASR 操作的格式为：通用寄存器，ASR 操作数

ASR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用第31位的值来填充。其中，操作数可以是通用寄存器，也可以是立即数（0～31）。操作示例：

      MOV R0, R1, ASR#2 ；将R1中的内容右移两位后传送到R0中，左端用第31位的值来填充。

ROR操作

      ROR 操作的格式为：通用寄存器，ROR 操作数

ROR可完成对通用寄存器中的内容进行循环右移的操作，按操作数所指定的数量向右循环移位，左端用右端移出的位来填充。其中，操作数可以是通用寄存器，也可以是立即数（0～31）。显然，当进行32位的循环右移操作时，通用寄存器中的值不改变。操作示例：

      MOV R0, R1, ROR#2 ；将R1中的内容循环右移两位后传送到R0中。

RRX操作

      RRX 操作的格式为：通用寄存器，RRX 操作数

RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作，按操作数所指定的数量向右循环移位，左端用进位标志位C来填充。其中，操作数可以是通用寄存器，也可以是立即数（0～31）。操作示例：

      MOV R0, R1, RRX#2 ；将R1中的内容进行带扩展的循环右移两位后传送到R0中。

9. 协处理器指令

ARM微处理器可支持多达16个协处理器，用于各种协处理操作。在程序执行的过程中，每个协处理器只执行针对自身的协处理指令，忽略ARM处理器和其他协处理器的指令。

ARM的协处理器指令主要用于ARM处理器初始化ARM协处理器的数据处理操作，以及在ARM处理器的寄存器和协处理器的寄存器之间传送数据，在ARM协处理器的寄存器和存储器之间传送数据。ARM协处理器指令包括以下5条：

— CDP协处理器数操作指令。

— LDC协处理器数据加载指令。

— STC协处理器数据存储指令。

— MCR ARM处理器寄存器到协处理器寄存器的数据传送指令。

— MRC协处理器寄存器到ARM处理器寄存器的数据传送指令。

CDP指令

      CDP指令的格式为：CDP{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存
  器2，协处理器操作码2。

CDP指令用于ARM处理器通知ARM协处理器执行特定的操作,若协处理器不能成功完成特定的操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器和源寄存器均为协处理器的寄存器，指令不涉及ARM处理器的寄存器和存储器。指令示例：

      CDP P3，2，C12，C10，C3，4 ；该指令完成协处理器P3的初始化

LDC指令

      LDC指令的格式为：LDC{条件}{L} 协处理器编码,目的寄存器，[源寄存器]

LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。指令示例：

      LDC P3，C4，[R0] ；将ARM处理器的寄存器R0 所指向的存储器中的字数据传送到协处理
      器P3的寄存器C4中。

STC指令

      STC指令的格式为：STC{条件}{L} 协处理器编码,源寄存器，[目的寄存器]

STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。指令示例：

      STC P3，C4，[R0] ；将协处理器P3的寄存器C4中的字数据传送到ARM处理器的寄存器R0 所指向的
  存储器中。

MCR指令

      MCR指令的格式为：MCR{条件} 协处理器编码，协处理器操作码1，源寄存器，目的寄存器1，目的寄
  存器2，协处理器操作码2。

MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中，若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，源寄存器为ARM处理器的寄存器，目的寄存器1和目的寄存器2均为协处理器的寄存器。指令示例：

      MCR P3，3，R0，C4，C5，6 ；该指令将ARM处理器寄存器R0中的数据传送到协处理器P3的寄存器C4
  和C5中。

MRC指令

      MRC指令的格式为：MRC{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存
  器2，协处理器操作码2。

MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中，若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器为ARM处理器的寄存器，源寄存器1和源寄存器2均为协处理器的寄存器。指令示例：

      MRC P3，3，R0，C4，C5，6 ；该指令将协处理器P3的寄存器中的数据传送到ARM处理器寄存器

10. 异常产生指令

ARM微处理器所支持的异常指令有如下两条：

— SWI软件中断指令。

— BKPT断点中断指令。

SWI指令

      SWI指令的格式为：SWI{条件} 24位的立即数

SWI指令用于产生软件中断，以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务，指令中24位的立即数指定用户程序调用系统例程的类型，相关参数通过通用寄存器传递，当指令中24位的立即数被忽略时，用户程序调用系统例程的类型由通用寄存器R0的内容决定，同时，参数通过其他通用寄存器传递。指令示例：

      SWI 0x02 ；该指令调用操作系统编号位02的系统例程。

BKPT指令

      BKPT指令的格式为：BKPT 16位的立即数

BKPT指令产生软件断点中断，可用于程序的调试。

11. Thumb指令及应用

为兼容数据总线宽度为16位的应用系统，ARM体系结构除了支持执行效率很高的32位ARM指令集以外，同时支持16位的Thumb指令集。Thumb指令集是ARM指令集的一个子集，允许指令编码为16位的长度。与等价的32位代码相比较，Thumb指令集在保留32位代码优势的同时，大大节省了系统的存储空间。所有的Thumb指令都有对应的ARM指令，而且Thumb的编程模型也对应于ARM的编程模型，在应用程序的编写过程中，只要遵循一定的调用规则，Thumb子程序和ARM子程序就可以互相调用。当处理器在执行ARM程序段时，称ARM处理器处于ARM工作状态，当处理器在执行Thumb程序段时，称ARM处理器处于Thumb工作状态。与ARM指令集相比较，Thumb指令集中的数据处理指令的操作数仍然是32位，指令地址也为32位，但Thumb指令集为实现16位的指令长度，舍弃了ARM指令集的一些特性，如大多数的Thumb指令是无条件执行的，而几乎所有的ARM指令都是有条件执行的；大多数的Thumb数据处理指令的目的寄存器与其中一个源寄存器相同。由于Thumb指令的长度为16位，即只用ARM指令一半的位数来实现同样的功能，所以，要实现特定的程序功能，所需的Thumb指令的条数较ARM指令多。在一般的情况下， Thumb指令与ARM指令的时间效率和空间效率关系如下：

— Thumb代码所需的存储空间为ARM代码的60%～70%。

— Thumb代码使用的指令数比ARM代码多30%～40%。

— 若使用32位的存储器，ARM代码比Thumb代码快40%。

— 若使用16位的存储器，Thumb代码比ARM代码快40%～50%。

—与ARM代码相比较，使用Thumb代码，存储器的功耗会降低30%。

显然，ARM指令集和Thumb指令集各有其优点，若对系统的性能有较高要求，应使用32位的存储系统和ARM指令集，若对系统的成本及功耗有较高要求，则应使用16位的存储系统和Thumb指令集。当然，若两者结合使用，充分发挥其各自的优点，会取得更好的效果。

1.2.6 GNU ARM汇编的格式

GNU ARM的任何汇编行都是如下结构：

        [<label>:] [<instruction or directive>} @ comment
      [<标签>:] [<指令>] @ 注释

GNU ARM汇编中，任何以冒号结尾的都被认为是一个标签，而不一定非要在一行的开始。下面是一个简单的例子，这段汇编程序定义了一个“add”的函数，该函数返回两个参数的和：

      .section .text, "x"
      .global add                   @ give the symbol add external linkage
      add:
          ADD r0, r0, r1            @ add input arguments
          MOV pc, lr                 @ return from subroutine
                                    @ end of program

表1-3列出了一些GNU ARM汇编指令，并给出了相应说明。

表1-3 GNU ARM的汇编标识符及对应的功能描述