jasmine214--love

          只有當你的內心總是充滿快樂、美好的愿望和寧靜時,你才能擁有強壯的體魄和明朗、快樂或者寧靜的面容。
          posts - 731, comments - 60, trackbacks - 0, articles - 0

          LPTSTR、LPCSTR、LPCTSTR、LPSTR的來源及意義

          Posted on 2010-08-17 13:14 幻海藍夢 閱讀(271) 評論(0)  編輯  收藏 所屬分類: C++
           

          原文:http://dev.firnow.com/course/3_program/c++/cppjs/20090403/163954.html 
          LPTSTRLPCSTRLPCTSTRLPSTR的來源及意義

          UNICODE:它是用兩個字節表示一個字符的方法。比如字符'A'ASCII下面是一個字符,可'A'UNICODE下面是兩個字符,高字符用0填充,而且漢字''ASCII下面是兩個字節,而在UNICODE下仍舊是兩個字節

          UNICODE的用處就是定長表示世界文字,據統計,用兩個字節可以編碼現存的所有文字而沒有二義。

          MBCS,它是多字節字符集,它是不定長表示世界文字的編碼。MBCS表示英文字母時就和ASCII一樣(這也是我們容易把MBCSASCII搞混的原因),但表示其他文字時就需要用多字節。 

          WINDOWS下面的程序設計可以支持MBCSUNICODE兩種編碼的字符串,具體用那種就看你定義了MBCS宏還是UNICODE宏。MBCS宏對應的字符串指針是char*也就是LPSTRUNICODE對應的指針是unsigned   short*也就是LPWSTR,為了寫程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*,   UNICODE下它是unsigned   char*,這樣你就可以重定義一個宏進行不同字符集的轉換了。

          LPTSTRLPCSTRLPCTSTRLPSTR的意義:

          LPSTR32bit指針 指向一個字符串,每個字符占1字節

          LPCSTR:32-bit指針 指向一個常字符串,每個字符占1字節

          LPCTSTR:32-bit指針 指向一個常字符串,每字符可能占1字節或2字節,取決于Unicode是否定義

          LPTSTR:32-bit指針 每字符可能占1字節或2字節,取決于Unicode是否定義

          Windows使用兩種字符集ANSIUNICODE,前者就是通常使用的單字節方式,但這種方式處理象中文這樣的雙字節字符不方便,容易出現半個漢字的情況。而后者是雙字節方式,方便處理雙字節字符。

          WindowsNT的所有與字符有關的函數都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T一般同字常數相關,如_T("Hello"。如果你編譯一個程序為ANSI方式,_T實際不起任何作用。而如果編譯一個程序為UNICODE方式,則編譯器會把"Hello"字符串以UNICODE方式保存。_T_L的區別在于,_L不管你是以什么方式編譯,一律UNICODE方式保存.

          Windows核心編程的第一章。

          L是表示字符串資源為Unicode的。

          比如

          wchar_t Str[] = L"Hello World!";

          這個就是雙子節存儲字符了。

          _T是一個適配的宏~

          #ifdef _UNICODE的時候

          _T就是L

          沒有#ifdef _UNICODE的時候

          _T就是ANSI的。

          比如

          LPTSTR lpStr = new TCHAR[32];

          TCHAR* szBuf = _T("Hello");

          以上兩句使得無論是在UNICODE編譯條件下都是正確編譯的。

          而且MS推薦你使用相匹配的字符串函數。

          比如處理LPTSTR或者LPCTSTR 的時候,不要用strlen ,而是要用_tcslen

          否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。

          T是非常有意思的一個符號(TCHARLPCTSTRLPTSTR_T()_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時候才決定

          vc++中有著各種字符串的表示法,如您所說。        

          首先char*   是指向ANSI字符數組的指針,其中每個字符占據8位(有效數據是除掉最高位的其他7位),這里保持了與傳統的C,C++的兼容。      

           LP的含義是長指針(long   pointer)

          LPSTR是一個指向以‘"0’結尾的ANSI字符數組的指針,與char*可以互換使用,在win32中較多地使用LPSTR。而LPCSTR中增加的‘C’的含義是“CONSTANT”(常量),表明這種數據類型的實例不能被使用它的API函數改變,除此之外,它與LPSTR是等同的。    

              為了滿足程序代碼國際化的需要,業界推出了Unicode標準,它提供了一種簡單和一致的表達字符串的方法,所有字符中的字節都是16位的值,其數量也可以滿足差不多世界上所有書面語言字符的編碼需求,開發程序時使用Unicode(類型為wchar_t)是一種被鼓勵的做法。    

              LPWSTRLPCWSTR由此產生,它們的含義類似于LPSTRLPCSTR,只是字符數據是16位的wchar_t而不是char       

           然后為了實現兩種編碼的通用,提出了TCHAR的定義:   

          如果定義_UNICODE,聲明如下:     typedef   wchar_t   TCHAR;    

          如果沒有定義_UNICODE,則聲明如下:     typedef   char   TCHAR;     

          LPTSTRLPCTSTR中的含義就是每個字符是這樣的TCHAR       

          CString類中的字符就是被聲明為TCHAR類型的,它提供了一個封裝好的類供用戶方便地使用。

          如果您還需要進一步的信息,請參看http://msdn.microsoft.com/library/default.asp?url=/library/en-us/vclib/html/_crt_data_type_mappings.asp等其他有關信息。

          LPTSTRLPCSTRLPCTSTRLPSTR之間的轉換:

          如何理解LPCTSTR類型?

          2007-11-10 21:43

          L表示long指針

          這是為了兼容Windows 3.116位操作系統遺留下來的,在win32中以及其他的32為操作系統中, long指針和near指針及far修飾符都是為了兼容的作用。沒有實際意義。

          P表示這是一個指針

          C表示是一個常量

          T表示在Win32環境中,有一個_T

          這個宏用來表示你的字符是否使用UNICODE, 如果你的程序定義了UNICODE或者其他相關的宏,那么這個字符或者字符串將被作為UNICODE字符串,否則就是標準的ANSI字符串。

          STR表示這個變量是一個字符串

          所以LPCTSTR就表示一個指向常固定地址的可以根據一些宏定義改變語義的字符串。

          同樣, LPCSTR就只能是一個ANSI字符串,在程序中我們大部分時間要使用帶T的類型定義。

          LPCTSTR == const TCHAR *

          CString LPCTSTR 可以說通用。 原因在于CString定義的自動類型轉換,沒什么奇特的,最簡單的C++操作符重載而已。

          常量字符串ansiunicode的區分是由宏_T來決定的。但是用_T("abcd")時, 字符串"abcd"就會根據編譯時的是否定一_UNICODE來決定是char* 還是 w_char* 同樣,TCHAR 也是相同目的字符宏。 看看定義就明白了。簡單起見,下面只介紹 ansi 的情況,unicode 可以類推。

          ansi情況下,LPCTSTR 就是 const char*, 是常量字符串(不能修改的)。

          LPTSTR 就是 char*, 即普通字符串(非常量,可修改的)。

          這兩種都是基本類型, CString C++類, 兼容這兩種基本類型是最起碼的任務了。

          由于const char* 最簡單(常量,不涉及內存變更,操作迅速), CString 直接定義了一個類型轉換函數

          operator LPCTSTR() {......} 直接返回他所維護的字符串。

          當你需要一個const char* 而傳入了CString時, C++編譯器自動調用 CString重載的操作符 LPCTSTR()來進行隱式的類型轉換。

          當需要CString , 而傳入了 const char* 時(其實 char* 也可以),C++編譯器則自動調用CString的構造函數來構造臨時的 CString對象。

          因此CString LPCTSTR 基本可以通用。

          但是 LPTSTR又不同了,他是 char* 意味著你隨時可能修改里面的數據,這就需要內存管理了(如字符串變長,原來的存貯空間就不夠了,則需要重新調整分配內存)

          所以 不能隨便的將 const char* 強制轉換成 char* 使用。

          樓主舉的例子

          LPSTR lpstr = (LPSTR)(LPCTSTR)string;

          就是這種不安全的使用方法。

          這個地方使用的是強制類型轉換,你都強制轉換了,C++編譯器當然不會拒絕你,但同時他也認為你確實知道自己要做的是什么。因此是不會給出警告的。

          強制的任意類型轉換是C(++)的一項強大之處,但也是一大弊端。這一問題在 vc6 以后的版本(僅針對vc而言)中得到逐步的改進(你需要更明確的類型轉換聲明)

          其實在很多地方都可以看到類似

          LPSTR lpstr = (LPSTR)(LPCTSTR)string;

          地用法,這種情況一般是函數的約束定義不夠完善的原因, 比如一個函數接受一個字符串參數的輸入,里面對該字符串又沒有任何的修改,那么該參數就應該定義成 const char* 但是很多初學者弄不清const地用法,或者是懶, 總之就是隨意寫成了 char* 這樣子傳入CString時就需要強制的轉換一下。

          這種做法是不安全的,也是不被建議的用法,你必須完全明白、確認該字符串沒有被修改。

          CString 轉換到 LPTSTR (char*), 預定的做法是調用CStringGetBuffer函數,使用完畢之后一般都要再調用ReleaseBuffer函數來確認修改 (某些情況下也有不調用ReleaseBuffer的,同樣你需要非常明確為什么這么做時才能這樣子處理,一般應用環境可以不考慮這種情況)

          同時需要注意的是, GetBuffer ReleaseBuffer之間,CString分配了內存交由你來處理,因此不能再調用其他的CString函數。

          CString LPCTSTR:

          CString cStr;

          const char *lpctStr=(LPCTSTR)cStr;

          LPCTSTRCString:

          LPCTSTR lpctStr;

          CString cStr=lpctStr;

          主站蜘蛛池模板: 社旗县| 景谷| 达拉特旗| 赣州市| 鲜城| 登封市| 揭西县| 康马县| 阿克| 阿拉尔市| 和龙市| 肥东县| 阿拉善左旗| 柳林县| 青州市| 盐城市| 青冈县| 依安县| 涿州市| 东城区| 神木县| 东兰县| 星子县| 昌乐县| 沧州市| 韶关市| 迁安市| 宁国市| 古浪县| 上犹县| 昂仁县| 梨树县| 砀山县| 荥经县| 华坪县| 涿鹿县| 洪洞县| 定远县| 宝丰县| 余姚市| 鹤峰县|