一直想不透C++引用的本質(zhì)是什么
在學(xué)校的教材《C++程序設(shè)計(jì)教程》(清華大學(xué)出版社 錢能)中是這樣說的“引用是個(gè)別名...引用作為目標(biāo)的別名而使用...引用不是值不占存儲(chǔ)空間...引用只有聲明,沒有定義...”
我一直以為編譯器處理引用時(shí)會(huì)把它當(dāng)作是變量的別名 用實(shí)際的變量去代替
今天發(fā)現(xiàn)這篇文章
原文在http://www.rayoko.com/article/201.htm
以下是文章的內(nèi)容:
探索c++的底層機(jī)制
在看這篇文章之前,請(qǐng)你先要明白一點(diǎn):那就是c++為我們所提供的各種存取控制僅僅是在編譯階段給我們的限制,也就是說是編譯器確保了你在完成任務(wù)之前的正確行為,如果你的行為不正確,那么你休想構(gòu)造出任何可執(zhí)行程序來。但如果真正到了產(chǎn)生可執(zhí)行代碼階段,無論是c,c++,還是pascal,大家都一樣,你認(rèn)為c和c++編譯器產(chǎn)生的機(jī)器代碼會(huì)有所不同嗎,你認(rèn)為c++產(chǎn)生的機(jī)器代碼會(huì)有訪問限制嗎?那么你錯(cuò)了。什么const,private,統(tǒng)統(tǒng)沒有(const變量或許會(huì)放入只讀數(shù)據(jù)段),它不會(huì)再給你任何的限制,你可以利用一切內(nèi)存修改工具或者是自己寫一個(gè)程序?qū)δ骋贿M(jìn)程空間的某一變量進(jìn)行修改,不管它在你的印象中是private,還是public,對(duì)于此時(shí)的你來說都一樣,想怎樣便怎樣。另外,你也不要為c++所提供的什么晚期捆綁等機(jī)制大呼神奇,它也僅僅是在所產(chǎn)生的代碼中多加了幾條而已,它遠(yuǎn)沒有你想象的那么智能,所有的工作都是編譯器幫你完成,真正到了執(zhí)行的時(shí)候,計(jì)算機(jī)會(huì)完全按照編譯器產(chǎn)生的代碼一絲不茍的執(zhí)行。你明白我在說什么嗎?對(duì)了,如果你從前接觸過匯編,只要你反匯編一段c++代碼,你就會(huì)說:原來是這么回事呀,c++只不過是把我們的問題進(jìn)行了更高層次的抽象,但只要你解開面紗,回到問題的本源,一切都將變得不再神秘……
(以下的反匯編代碼均來自visial c++ 7.0)
一.讓我們從變量開始-----并非你想象的那么簡(jiǎn)單
變量是什么,變量就是一個(gè)在程序執(zhí)行過程中可以改變的量。換一個(gè)角度,變量是一塊內(nèi)存區(qū)域的名字,它就代表這塊內(nèi)存區(qū)域,當(dāng)我們對(duì)變量進(jìn)行修改的時(shí)候,會(huì)引起內(nèi)存區(qū)域中內(nèi)容的改變。但是你若是學(xué)習(xí)過匯編或是計(jì)算機(jī)組成原理,那么你就會(huì)清楚對(duì)于一塊內(nèi)存區(qū)域來說,根本就不存在什么名字,它所僅有的標(biāo)志就是他的地址,因此我們?nèi)粝胄薷囊粔K內(nèi)存區(qū)域的內(nèi)容,只有知道他的地址方能實(shí)現(xiàn)。看來所謂的變量一說只不過是編譯器給我們進(jìn)行的一種抽象,讓我們不必去了解更多的細(xì)節(jié),降低我們的思維跨度而已。例如下面這條語句:
int a=10;
按照我們的思維習(xí)慣來講,就是“存在一個(gè)變量a,它的值是10”,一切都顯得那么的自然。我們不必去在乎什么所謂的地址以及其他的一些細(xì)節(jié)。然而在這條語句的底層實(shí)現(xiàn)中,a已經(jīng)不能算是一個(gè)變量了,它僅僅是一個(gè)標(biāo)記,代表一個(gè)地址的標(biāo)記:
mov dword ptr[a],0Ah;
怎么樣,這條語句不像上面那條易于接受吧,因?yàn)樗枰私飧嗟募?xì)節(jié),你幾乎不能得到編譯器的任何幫助,一切思維上的跨越必須由你自己完成。這條語句應(yīng)該解釋為“把10寫入以a為地址的內(nèi)存區(qū)域”。你說什么?a有些像指針?對(duì),的確像,但還不是,只不過他們的過程似乎是類似的。這里所說的跨越實(shí)際上就是從一個(gè)現(xiàn)實(shí)問題到具體地址以及內(nèi)存區(qū)域的跨越。
二.引用:你可以擁有引用,但編譯器僅擁有指針(地址)
看過了第一條,你一定對(duì)編譯器的工作有了一定的了解,實(shí)際上編譯器就是程序員與底層之間的一個(gè)轉(zhuǎn)換層,它把一個(gè)高級(jí)語言代碼轉(zhuǎn)換為低級(jí)語言代碼,一個(gè)編譯器完成的轉(zhuǎn)換跨度越大,那么它也就會(huì)越復(fù)雜,因?yàn)槌绦騿T的工作都由他代為完成了。C++編譯器必然比匯編編譯器復(fù)雜就是這個(gè)道理。如果我問你引用和指針是一樣的嗎?你或許會(huì)說當(dāng)然不一樣了,指針容易產(chǎn)生不安全的因素,引用卻不會(huì),真的不會(huì)嗎?我們來看下面這段代碼:
int *e=new int(10);
int &f=*e;
delete e;
f=30;
你認(rèn)為上面這段代碼怎么樣,我感覺就不很安全,它和指針有相同的隱患。因?yàn)樗玫膬?nèi)存區(qū)域就不合法。
我個(gè)人認(rèn)為,所謂的引用其實(shí)就是一種指針,只不過二者的接口并不相同,引用的接口有一定的限制。指針可以一對(duì)多,而引用卻只能一對(duì)一,即&refer不能被改變,但卻并不能說一對(duì)一就是安全的,只不過危險(xiǎn)的系數(shù)降低罷了。引用比指針更容易控制。
Ok,下面來說說指針,曾經(jīng)有過匯編經(jīng)驗(yàn)的人一定會(huì)說,恩,指針的某些地方有些像匯編,尤其是那個(gè)“*”,怎么就那么像匯編中的“[]”啊。呵呵,的確,它也涵蓋了一個(gè)尋址的過程。看來指針的確是個(gè)比較低級(jí)的東西。然而引用卻并不那么直接,雖然程序員用起來方便安全了許多。但是你要清楚,只有你可以擁有引用,編譯器可沒有這個(gè)工具,計(jì)算機(jī)并不認(rèn)識(shí)這個(gè)東西。因此,它的底層機(jī)制實(shí)際上是和指針一樣的。不要相信只有一塊內(nèi)存拷貝,不要認(rèn)為引用可以為你節(jié)省一個(gè)指針的空間,因?yàn)檫@一切不會(huì)發(fā)生,編譯器還是會(huì)把引用解釋為指針。不管你相不相信,請(qǐng)看下面這段代碼:
int& b=a;
lea eax,[a];
mov dword ptr[b],eax;把a(bǔ)的地址賦給地址為b的一塊內(nèi)存
b=50;
mov eax,dword ptr[b];
mov dword ptr[eax],32h;
int *d=&a;
lea eax,[a];
mov dword ptr[d],eax
*d=60;
mov eax,dword ptr[d]
mov dword ptr[eax],3ch;
以上的代碼均來自具體的編譯器,怎么樣,相信了吧,好,讓我再來做一個(gè)或許不怎么恰當(dāng)?shù)谋葦M,你一定編過有關(guān)線性表和棧的程序吧,線性表是一個(gè)非常靈活的數(shù)據(jù)結(jié)構(gòu),在他上面有許多的操作,然而棧呢,它是一個(gè)限制性操作的線性表,它的底層操作實(shí)際上是由線性表操作實(shí)現(xiàn)的。就好比stack與vector的關(guān)系,因此指針和引用的關(guān)系就好比線性表和棧的關(guān)系,引用也就是受限的指針,它對(duì)外的接口和指針雖然并不一樣,但底層是相同的。
下面再來看看引用的一個(gè)重要用途,作為函數(shù)的參數(shù)傳遞的時(shí)候是怎樣的情形:
void swapr(int &a, int &b);
void swapr(int* a, int *b);
int a=10;
int b=20;
swapr(a, b);
lea eax,[a];
push eax; //把a(bǔ)的地址壓入堆棧
lea ecx,[b];
push ecx;
call swapr;
swapr(&a, &b);
lea eax,[a];
push eax;
lea ecx,[b];
push ecx;
call swapr;
怎么樣,用引用和指針傳遞參數(shù)無論是在效率上還是在空間上都是完全一樣的,如果妄想不傳入地址就修改實(shí)參的值,簡(jiǎn)直就是天方夜譚,這就說明引用的本質(zhì)就是指針。畢竟它們的行為都太相似了,如果不是這樣,你還有什么方法去實(shí)現(xiàn)引用嗎?記住,引用只不過是編譯器為你提供的一個(gè)有用且安全的工具,對(duì)于機(jī)器代碼可無法表示它,它把指針一對(duì)多的缺點(diǎn)去除,禁止了你的不安全的操作。但回到問題的本源,他們沒有任何區(qū)別。