內聯彙編

使用匯編語言筆編程最常見的方式是在高級語言(C和C++)程序內編寫彙編函數,這種吧彙編語言直接寫到C和C++語言程序內的技術稱為內聯彙編。

GNU的C編譯器使用asm關鍵字指出使用匯編語言編寫的源代碼段落。asm段的基本格式如下:

asm("as code");

括號中的彙編指令必須在括號,指令超過一條的話必須使用新的行分隔彙編語言代碼每一行,因為編譯器逐字地取得asm段中彙編代碼,並且把它們放在為程序生成的彙編代碼中,有時可以使用製表符字符縮進指令以便它們和標籤區別開。下面是一個簡單的內聯彙編的示例:

asm("movl $1, %eax\n\t movl $0,%ebx\n\tint $0x80");

該示例包括3條指令,在使用很多彙編指令時會顯得有些混亂,所以一般把指令放在單獨的行中。

asm("movl $1, %eax\n\t"
    "movl $0,%ebx\n\t"
    "int $0x80");

利用C全局變量可以把數據傳遞進和傳遞出內聯彙編語言,注意不能使用局部變量。

#include <stdio.h>
int     result = 10;
int main(int argc, const char *argv[])
{
    asm("addl $1, result\n\t"
        "subl $2, result\n\t");
    printf("the result is  %d\n", result);
    return 0;
}

使用gcc生成彙編代碼如下:

.file "inline-as.c"
.globl result
.data
.align 4
.type result, @object
.size result, 4
result:
.long 10
.section .rodata
.LC0:
.string "the result is  %d\n"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $16, %esp
#APP
# 7 "inline-as.c" 1
addl $1, result
subl $2, result

# 0 "" 2
#NO_APP
movl result, %edx
movl $.LC0, %eax
movl %edx, 4(%esp)
movl %eax, (%esp)
call printf
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.4.7 20120313 (Red Hat 4.4.7-3)"
.section .note.GNU-stack,"",@progbits

c文件編譯執行結果為:

$ ./inline-as
the result is  9
$

反編譯的彙編代碼中#APP和#NOAPP之間的代碼為asm段指定的內聯彙編代碼。 ANSI C規範在使用內聯彙編語句時使用關鍵字asm替換關鍵字asm,因為ANSI C 關鍵字asm用於其他用途。如下:

__asm__("addl $1, result\n\t"
        "subl $2, result\n\t");

基本的asm格式提供創建彙編代碼的簡單樣式,但是有一些侷限性。首先,所有輸入值和輸出值都必須使用C程序的全局變量,如上示例所見。其次,在內聯彙編代碼中不去改變任何寄存器的值。GNU編譯器提供asm段的擴展格式來幫助解決這些問題。擴展格式採用新的格式,如下:

asm ("as code": output location : input operands : changed registers);

該格式由4個部分構成,使用冒號分隔:彙編代碼、輸出位置、輸入操作數、改動的寄存器。在擴展asm格式中,不是所有部分必須出現。

大多數程序員把內聯彙編代碼定義為宏函數,定義方式和C語言類似。定義內聯彙編宏函數如下:

#define CAL ({
            asm("addl $1, result\n\t"
            "subl $2, result\n\t");
            })

這裡asm語句必須要在一對花括號中,以便指出語句的開頭和結尾,否則編譯器會生成錯誤信息。 如下為使用宏的一個簡單示例:

#include <stdio.h>
#define CAL ({ \
    asm("addl $1, result\n\t"\
        "subl $2, result\n\t");\
        })
int     result = 10;
int main(int argc, const char *argv[])
{
    CAL;
    printf("the result is  %d\n", result);
    return 0;
}