3.4 Gcc 編譯器
GNU CC(簡稱為Gcc)是GNU項目中符合ANSI C 標準的編譯系統,能夠編譯用C、C++和Object C等語言編寫的程序。Gcc不僅功能強大,而且可以編譯如C、C++、Object C、Java、Fortran、Pascal、Modula-3 和Ada 等多種語言,而且Gcc 又是一個交叉平臺編譯器,它能夠在當前CPU平臺上為多種不同體系結構的硬件平臺開發軟件,因此尤其適合在嵌入式領域的開發編譯。本章中的示例,除非特別注明,否則均采用Gcc版本為4.0.0。
下表3.6 是Gcc支持編譯源文件的后綴及其解釋。
表3.6 Gcc所支持后綴名解釋
后綴名 所對應的語言 后綴名 所對應的語言
.c C原始程序 .s/.S 匯編語言原始程序
.C/.cc/.cxx C++原始程序 .h 預處理文件(頭文件)
.m Objective-C原始程序 .o 目標文件
.i 已經過預處理的C原始程序 .a/.so 編譯后的庫文件
.ii 已經過預處理的C++原始程序
3.4.1 Gcc編譯流程解析
如本章開頭提到的,Gcc的編譯流程分為了4個步驟,分別為:
· 預處理(Pre-Processing);
· 編譯(Compiling);
· 匯編(Assembling);
· 鏈接(Linking)。
下面就具體來查看一下Gcc是如何完成4 個步驟的。
首先,有以下hello.c源代碼:
#include<stdio.h>
int main()
{
printf("Hello! This is our embedded world!\n");
return 0;
}
(1)預處理階段
在該階段,編譯器將上述代碼中的stdio.h編譯進來,并且用戶可以使用Gcc的選項“-E”進行查看,該選項的作用是讓Gcc在預處理結束后停止編譯過程。
注意
Gcc指令的一般格式為:Gcc [選項] 要編譯的文件 [選項] [目標文件]
其中,目標文件可缺省,Gcc默認生成可執行的文件,命為:編譯文件.out
[root@localhost Gcc]# Gcc –E hello.c –o hello.i
在此處,選項“-o”是指目標文件,由表3.6 可知,“.i”文件為已經過預處理的C 原始程序。以下列出了hello.i文件的部分內容:
typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);
…
# 2 "hello.c" 2
int main()
{
printf("Hello! This is our embedded world!\n");
return 0;
}
由此可見,Gcc確實進行了預處理,它把“stdio.h”的內容插入到hello.i文件中。
(2)編譯階段
接下來進行的是編譯階段,在這個階段中,Gcc 首先要檢查代碼的規范性、是否有語法錯誤等,以確定代碼的實際要做的工作,在檢查無誤后,Gcc把代碼翻譯成匯編語言。用戶可以使用“-S”選項來進行查看,該選項只進行編譯而不進行匯編,生成匯編代碼。
[root@localhost Gcc]# Gcc –S hello.i –o hello.s
以下列出了hello.s的內容,可見Gcc已經將其轉化為匯編了,感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。
.file "hello.c"
.section .rodata
.align 4
.LC0:
.string "Hello! This is our embedded world!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax
addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0
call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
.section .note.GNU-stack,"",@progbits
(3)匯編階段
匯編階段是把編譯階段生成的“.s”文件轉成目標文件,讀者在此可使用選項“-c”就可看到匯編代碼已轉化為“.o”的二進制目標代碼了。如下所示:
[root@localhost Gcc]# Gcc –c hello.s –o hello.o
(4)鏈接階段
在成功編譯之后,就進入了鏈接階段。在這里涉及到一個重要的概念:函數庫。讀者可以重新查看這個小程序,在這個程序中并沒有定義“printf”的函數實現,且在預編譯中包含進的“stdio.h”中也只有該函數的聲明,而沒有定義函數的實現,那么,是在哪里實現“printf”函數的呢?最后的答案是:系統把這些函數實現都被做到名為libc.so.6的庫文件中去了,在沒有特別指定時,Gcc會到系統默認的搜索路徑“/usr/lib”下進行查找,也就是鏈接到libc.so.6庫函數中去,這樣就能實現函數“printf”了,而這也就是鏈接的作用。函數庫一般分為靜態庫和動態庫兩種。靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其后綴名一般為“.a”。動態庫與之相反,在編譯鏈接時并沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般后綴名為“.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。完成了鏈接之后,Gcc就可以生成可執行文件,如下所示。
[root@localhost Gcc]# Gcc hello.o –o hello
運行該可執行文件,出現正確的結果如下。
[root@localhost Gcc]# ./hello
Hello! This is our embedded world!
3.4.2 Gcc編譯選項分析
Gcc 有超過100 個的可用選項,主要包括總體選項、告警和出錯選項、優化選項和體系
結構相關選項。以下對每一類中最常用的選項進行講解。
(1)總體選項
Gcc的總結選項如表3.7 所示,很多在前面的示例中已經有所涉及。
表3.7 Gcc總體選項列表
-c 只是編譯不鏈接,生成目標文件“.o”
-S 只是編譯不匯編,生成匯編代碼
-E 只進行預編譯,不做其他處理
-g 在可執行程序中包含標準調試信息
-o file 把輸出文件輸出到file里
-v 打印出編譯器內部編譯各過程的命令行信息和編譯器的版本
-I dir 在頭文件的搜索路徑列表中添加dir目錄
-L dir 在庫文件的搜索路徑列表中添加dir目錄
-static 鏈接靜態庫
-llibrary 連接名為library的庫文件
對于“-c”、“-E”、“-o”、“-S”選項在前一小節中已經講解了其使用方法,在此主要講解另外兩個非常常用的庫依賴選項“-I dir”和“-L dir”。
· “-I dir”
正如上表中所述,“-I dir”選項可以在頭文件的搜索路徑列表中添加dir 目錄。由于Linux中頭文件都默認放到了“/usr/include/”目錄下,因此,當用戶希望添加放置在其他位置的頭文件時,就可以通過“-I dir”選項來指定,這樣,Gcc就會到相應的位置查找對應的目錄。比如在“/root/workplace/Gcc”下有兩個文件:
/*hello1.c*/
#include<my.h>
int main()
{
printf("Hello!!\n");
return 0;
}
/*my.h*/
#include<stdio.h>
這樣,就可在Gcc命令行中加入“-I”選項:
[root@localhost Gcc] Gcc hello1.c –I /root/workplace/Gcc/ -o hello1
這樣,Gcc就能夠執行出正確結果。
小知識
在include語句中,“<>”表示在標準路徑中搜索頭文件,““””表示在本目錄中搜索。故在上例中,可把hello1.c的“#include<my.h>”改為“#include “my.h””,就不需要加上“-I”選項了。
· “-L dir”選項“-L dir”的功能與“-I dir”類似,能夠在庫文件的搜索路徑列表中添加dir 目錄。
例如有程序hello_sq.c需要用到目錄“/root/workplace/Gcc/lib”下的一個動態庫libsunq.so,則
只需鍵入如下命令即可:
[root@localhost Gcc] Gcc hello_sq.c –L /root/workplace/Gcc/lib –lsunq –o hello_sq
需要注意的是,“-I dir”和“-L dir”都只是指定了路徑,而沒有指定文件,因此不能在路徑中包含文件名。
另外值得詳細解釋一下的是“-l”選項,它指示Gcc去連接庫文件libsunq.so。由于在Linux下的庫文件命名時有一個規定:必須以l、i、b 3 個字母開頭。因此在用-l選項指定鏈接的庫文件名時可以省去l、i、b 3個字母。也就是說Gcc在對“-lsunq”進行處理時,會自動去鏈接名為libsunq.so的文件。
(2)告警和出錯選項
Gcc的告警和出錯選項如表3.8 所示。
表3.8 Gcc總體選項列表
選 項 含 義
-ansi 支持符合ANSI標準的C程序
-pedantic 允許發出ANSI C標準所列的全部警告信息
續表
選 項 含 義
-pedantic-error 允許發出ANSI C標準所列的全部錯誤信息
-w 關閉所有告警
-Wall 允許發出Gcc提供的所有有用的報警信息
-werror 把所有的告警信息轉化為錯誤信息,并在告警發生時終止編譯過程
下面結合實例對這幾個告警和出錯選項進行簡單的講解。
如有以下程序段:
#include<stdio.h>
void main()
{
long long tmp = 1;
printf("This is a bad code!\n");
return 0;
}
這是一個很糟糕的程序,讀者可以考慮一下有哪些問題?
· “-ansi”
該選項強制Gcc生成標準語法所要求的告警信息,盡管這還并不能保證所有沒有警告的程序都是符合ANSI C標準的。運行結果如下所示:
[root@localhost Gcc]# Gcc –ansi warning.c –o warning
warning.c: 在函數“main”中:
warning.c:7 警告:在無返回值的函數中,“return”帶返回值
warning.c:4 警告:“main”的返回類型不是“int”
可以看出,該選項并沒有發現“long long”這個無效數據類型的錯誤。
· “-pedantic”
允許發出ANSI C標準所列的全部警告信息,同樣也保證所有沒有警告的程序都是符合
ANSI C標準的。其運行結果如下所示:
[root@localhost Gcc]# Gcc –pedantic warning.c –o warning
warning.c: 在函數“main”中:
warning.c:5 警告:ISO C90不支持“long long”
warning.c:7 警告:在無返回值的函數中,“return”帶返回值
warning.c:4 警告:“main”的返回類型不是“int”
可以看出,使用該選項查看出了“long long”這個無效數據類型的錯誤。
· “-Wall”
允許發出Gcc能夠提供的所有有用的報警信息。該選項的運行結果如下所示:
[root@localhost Gcc]# Gcc –Wall warning.c –o warning
warning.c:4 警告:“main”的返回類型不是“int”
warning.c: 在函數“main”中:
warning.c:7 警告:在無返回值的函數中,“return”帶返回值
warning.c:5 警告:未使用的變量“tmp”
使用“-Wall”選項找出了未使用的變量tmp,但它并沒有找出無效數據類型的錯誤。
另外,Gcc 還可以利用選項對單獨的常見錯誤分別指定警告,有關具體選項的含義感興
趣的讀者可以查看Gcc手冊進行學習。
(3)優化選項
Gcc可以對代碼進行優化,它通過編譯選項“-On”來控制優化代碼的生成,其中n是一個代表優化級別的整數。對于不同版本的Gcc 來講,n 的取值范圍及其對應的優化效果可能并不完全相同,比較典型的范圍是從0變化到2或3。
不同的優化級別對應不同的優化處理工作。如使用優化選項“-O”主要進行線程跳轉(Thread Jump)和延遲退棧(Deferred Stack Pops)兩種優化。使用優化選項“-O2”除了完成所有“-O1”級別的優化之外,同時還要進行一些額外的調整工作,如處理器指令調度等。選項“-O3”則還包括循環展開和其他一些與處理器特性相關的優化工作。雖然優化選項可以加速代碼的運行速度,但對于調試而言將是一個很大的挑戰。因為代碼在經過優化之后,原先在源程序中聲明和使用的變量很可能不再使用,控制流也可能會突然跳轉到意外的地方,循環語句也有可能因為循環展開而變得到處都有,所有這些對調試來講都將是一場噩夢。所以筆者建議在調試的時候最好不使用任何優化選項,只有當程序在最終發行的時候才考慮對其進行優化。
(4)體系結構相關選項
Gcc的體系結構相關選項如表3.9 所示。
表3.9 Gcc體系結構相關選項列表
選 項 含 義
-mcpu=type 針對不同的CPU使用相應的CPU指令。可選擇的type有i386、i486、pentium及i686等
-mieee-fp 使用IEEE標準進行浮點數的比較
-mno-ieee-fp 不使用IEEE標準進行浮點數的比較
-msoft-float 輸出包含浮點庫調用的目標代碼
-mshort 把int類型作為16位處理,相當于short int
-mrtd 強行將函數參數個數固定的函數用ret NUM返回,節省調用函數的一條指令
這些體系結構相關選項在嵌入式的設計中會有較多的應用,讀者需根據不同體系結構將
對應的選項進行組合處理。在本書后面涉及到具體實例會有針對性的講解。