801 WORKPLACE

          追尋夢想,自由生活

          BlogJava 首頁 新隨筆 聯系 聚合 管理
            10 Posts :: 1 Stories :: 1 Comments :: 0 Trackbacks

          轉載自:http://www.cnitblog.com/guopingleee/archive/2009/01/29/54047.html

          地址:
          http://bbs.chinaunix.net/viewthread.php?tid=981231&extra=&page=2


          我看這兩個的區別都不知為這有多愁, 就是看不懂, 想不通, 時間放長了, 真還是不懂, 學了這么時間都不懂兩個區別, 也不知什么時候用哪個EOF  feof , 一直為這困惑....不清,

          這兩個區別為什么搞不懂呢, 網上資講得真是迷惑不解,  我就一心找找找.....找找找....再找....

          找找找.....找找找....再找....找找找.....找找找....再找....
          找找找.....找找找....再找....沒有人來給你講區別, 有只自己給自己當老師, 自己就是世界上最好的老師.
          重點開始:


          看高手過招,學習了。

          版主說得對,getchar的定義是:int getchar(void), 應該返回int.

          原帖由 whyglinux 于  2008 - 6 - 6   22 : 46  發表 
          >>
           關于文件結束符EOF

          EOF 是 End Of File 的縮寫。

          在 C 語言中,它是在標準庫中定義的一個宏。

          人們經常誤認為 EOF 是從文件中讀取的一個字符。其實,EOF 不是一個字符,它被定義為是 
          int
           類型的一個  
          說的標準. 正解.
          >> 關于文件結束符EOF

          EOF 是 End Of File 的縮寫。

          在 C 語言中,它是在標準庫中定義的一個宏。

          人們經常誤認為 EOF 是從文件中讀取的一個字符(牢記)。其實,EOF 不是一個字符,它被定義為是 int 類型的一個負數(比如 -1)。EOF 也不是文件中實際存在的內容。EOF 也不是只表示讀文件到了結尾這一狀態(這種狀態可以用 feof() 來檢測),它還能表示 I/O 操作中的讀、寫錯誤(通常可以用 ferror() 來檢測)以及其它一些關聯操作的錯誤狀態。


          getchar 返回EOF如果讀到文件末
          大師級經典的著作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(SecondEdition)
          第1.5節的字符輸入/輸出,被getchar()和EOF所迷惑了。可能主要還是由于沒有搞清楚getchar()的工作原理和EOF的用法。因此,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過后就會淡忘的,只有寫下來才是最好的方法。


          其實,getchar()最典型的程序也就幾行代碼而已。本人所用的環境是DebianGNU/Linux,在其他系統下也一樣。
          一、getchar的兩點總結:
          1.getchar是以行為單位進行存取的。
          當用getchar進行輸入時,如果輸入的第一個字符為有效字符(即輸入是文件結束符EOF,Windows下為組合鍵Ctrl+Z,Unix/Linux下為組合鍵Ctrl+D),那么只有當最后一個輸入字符為換行符'\n'(也可以是文件結束符EOF,EOF將在后面討論)時,getchar才會停止執行,整個程序將會往下執行。譬如下面程序段:
          while((c =getchar())!=EOF){
              putchar(c);
          }

          執行程序,輸入:abc,然后回車。則程序就會去執行puchar(c),然后輸出abc,這個地方不要忘了,系統輸出的還有一個回車。然后可以繼續輸入,再次遇到換行符的時候,程序又會把那一行的輸入的字符輸出在終端上。


          對于getchar,肯定很多初學的朋友會問,getchar不是以字符為單位讀取的嗎?那么,既然我輸入了第一個字符a,肯定滿足while循環(c = getchar()) != EOF的條件阿,那么應該執行putchar(c)在終端輸出一個字符a。不錯,我在用getchar的時候也是一直這么想的,但是程序就偏偏不著樣執行,而是必需讀到一個換行符或者文件結束符EOF才進行一次輸出。

          對這個問題的一個解釋是,在大師編寫C的時候,當時并沒有所謂終端輸入的概念,所有的輸入實際上都是按照文件進行讀取的,文件中一般都是以行為單位的。因此,只有遇到換行符,那么程序會認為輸入結束,然后采取執行程序的其他部分。同時,輸入是按照文件的方式存取的,那么要結束一個文件的輸入就需用到EOF(Enf Of File). 這也就是為什么getchar結束輸入退出時要用EOF的原因。

          2.getchar()的返回值一般情況下是字符,但也可能是負值,即返回EOF。

          這里要強調的一點就是,getchar函數通常返回終端所輸入的字符,這些字符系統中對應的ASCII值都是非負的。因此,很多時候,我們會寫這樣的兩行代碼:
          char c;
          c =getchar();


          這樣就很有可能出現問題。因為getchar函數除了返回終端輸入的字符外,在遇到Ctrl+D(Linux下)即文件結束符EOF時,getchar()的返回EOF,這個EOF在函數庫里一般定義為-1。因此,在這種情況下,getchar函數返回一個負值,把一個負值賦給一個char型的變量是不正確的。為了能夠讓所定義的變量能夠包含getchar函數返回的所有可能的值,正確的定義方法如下(K&R C中特別提到了這個問題):
          int c;
          c =getchar();

          二、EOF的兩點總結(主要指普通終端中的EOF)
          1.EOF作為文件結束符時的情況:

          EOF雖然是文件結束符,但并不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現文件結束的功能,只有在下列的條件下,才作為文件結束符。
          (1)遇到getcahr函數執行時,要輸入第一個字符時就直接輸入Ctrl+D,就可以跳出getchar(),去執行程序的其他部分;
          (2)在前面輸入的字符為換行符時,接著輸入Ctrl+D;
          (3)在前面有字符輸入且不為換行符時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到文件結束符的功能,至于第一次的Ctrl+D的作用將在下面介紹。
          其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時,直接輸入Ctrl+D才相當于文件結束符。

          2.EOF作為行結束符時的情況,這時候輸入Ctrl+D并不能結束getchar(),而只能引發getchar()提示下一輪的輸入。

          這種情況主要是在進行getchar()新的一行輸入時,當輸入了若干字符(不能包含換行符)之后,直接輸入Ctrl+D,此時的Ctrl+D并不是文件結束符,而只是相當于換行符的功能,即結束當前的輸入。以上面的代碼段為例,如果執行時輸入abc,然后Ctrl+D,程序輸出結果為:
          abcabc

          注意:第一組abc為從終端輸入的,然后輸入Ctrl+D,就輸出第二組abc,同時光標停在第二組字符的c后面,然后可以進行新一次的輸入。這時如果再次輸入Ctrl+D,則起到了文件結束符的作用,結束getchar()。
          如果輸入abc之后,然后回車,輸入換行符的話,則終端顯示為:
          abc         //第一行,帶回車
          abc         //第二行
                         //第三行

          其中第一行為終端輸入,第二行為終端輸出,光標停在了第三行處,等待新一次的終端輸入。
          從這里也可以看出Ctrl+D和換行符分別作為行結束符時,輸出的不同結果。
          EOF的作用也可以總結為:當終端有字符輸入時,Ctrl+D產生的EOF相當于結束本行的輸入,將引起getchar()新一輪的輸入;當終端沒有字符輸入或者可以說當getchar()讀取新的一次輸入時,輸入Ctrl+D,此時產生的EOF相當于文件結束符,程序將結束getchar()的執行。
          【補充】本文第二部分中關于EOF的總結部分,適用于終端驅動處于一次一行的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字符 進行的。但是終端驅動處于一次一行的模式,它的輸入只有到“\n”或者EOF時才結束,因此,終端上得到的輸出也都是按行的。
          如果要實現終端在讀一個字符就結束輸入的話,下面的程序是一種實現的方法(參考《C專家編程》,略有改動)
          /*Edit by Godbach
            CU Blog: 
          http://blog.chinaunix.net/u/33048/
          */

          #include
          <stdio.h>
          #include
          <stdlib.h>

          int
          main(
          void)
          {
              
          int c;
              
          /* 終端驅動處于普通的一次一行模式 */
              system(
          "stty raw");
              
              
          /* 現在的終端驅動處于一次一個字符模式 */
              c 
          =getchar();
              putchar();
              
              
          /* 終端驅動處又回到一次一行模式 */
               system(
          "stty cooked");
              
              
          return 0;
          }


          編譯運行該程序,則當如入一個字符時,直接出處一個字符,然后程序結束。
          由此可見,由于終端驅動的模式不同,造成了getchar()輸入結束的條件不一樣。普通模式下需要回車或者EOF,而在一次一個字符的模式下,則輸入一個字符之后就結束了。

          希望本文可以對初學C的朋友提供一點幫助,也希望能和其他朋友進行交流。其中理解不對的地方若能得到指正和建議,本人將不勝感激。同時,本文參考了chinaunix.net關于getchar討論的帖子和一位博友的文章,鏈接地址分別為:
          http://blog.chinaunix.net/u/9861/showart_64652.html
          http://bbs.chinaunix.net/viewthread.php?tid=679688&extra=&page=1
          歡迎交流和指正。

          在另一個貼子中,我與一些朋友對 getc 展開了一些討論. 由于覺得樓主最終未能明白
          我的意思,所以我把我個人的看法總結出來,寫在這里.我不太擅長說明,但已經盡力了.
          任何人轉本貼, 請務必把本人的名字寫在顯眼的位置.  


          約定編譯器為 gcc2/x86:
          所以 char, unsigned char 為 8 位, int 為 32 位

          請參考 http://bbs.chinaunix.net/forum/23/20031223/229236.html


          (1) 字節的讀取

          在正常的情況下, getc 以 unsigned char 的方式讀取文件流, 擴張為一個整數,并返
          回. 換言之, getc 從文件流中取一個字節, 并加上24個零,成為一個小于256的整數,
          然后返回.

          int c;
          while ((c = fgetc (rfp))!= -1) // -1就是 EOF
          fputc (c, wfp);

          上面 fputc 中的 c 雖然是整數, 但在 fputc 將其寫入文件流之前, 又把整數的高24位
          去掉了, 因此 fgetc, putc 配合能夠實現文件復制. 到目前為止, 把 c 定義為
          char仍然是可行的, 但下面我們將看到,把 c 定義為 int 是為正確判段文件是否結束.

          (2) 判斷文件結束.

          多數人認為文件中有一個EOF,用于表示文件的結尾. 但這個觀點實際上是錯誤的,在文
          件所包含的數據中,并沒有什么文件結束符. 對getc 而言, 如果不能從文件中讀取,
          則返回一個整數 -1,這就是所謂的EOF. 返回 EOF 無非是出現了兩種情況,一是文件已
          經讀完; 二是文件讀取出錯,反正是讀不下去了.

          請注意: 在正常讀取的情況下, 返回的整數均小于256, 即0x0~0xFF. 而讀不出返回的
          是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里頭寫, 高24位被屏蔽,寫入的將
          是 0xFF. // lixforalpha 請注意這一點

          (3) 0xFF 會使我們混淆嗎?

          不會, 前提是, 接收返回值的 c 要按原型定義為 int.

          如果下一個讀取的字符將為 0xFF, 則

          int c;
          c = fgetc (rfp); // c = 0x000000FF;
          if (c != -1)    // 當然不等, -1 是 0xFFFFFFFF
          fputc (wfp);   // 噢, OXFF 復制成功.

          字符0xFF, 其本身并不是EOF.

          (4) 將 c 定義 char

          假定下一個讀取的字符為 0xFF 則

          char c;
          c = fgetc (rfp); // fgetc(rfp)的值為 0x000000FF, 暗中降為字節, c = 0xFF
          if (c != -1)    // 字符與整數比較? c 被帶符號(signed)擴展為0xFFFFFFFF, 喔噢,
          條件成立,文件復制提前退出.

          while ((c=fgetc(rfp))!=EOF) 中的判別條件成立, 文件復制結束! 意外中止.

          (5) 將 c 定義為 unsigned char;

          當讀到文件末尾, 返回 EOF 也就是 -1 時,

          unsigned char c;
          c = fgetc (rfp); // fgetc (rfp)的值為EOF,即-1,即0xFFFFFFFF, 降格為字節, c=0xFF
          if ( c!= -1)  // c 被擴展為 0x000000FF, 永遠不回等于 0xFFFFFFFF

          所以這次雖然能正確復制 0xFF, 但卻不能判斷文件結束. 事實上,在 c 為 uchar 時,
          c != -1 是永遠成立的, 一個高質量的編譯器, 比如 gcc會在編譯時指出這一點.

          (6) 為何需要feof?
          FILE *fp;
          fp 指向一個很復雜的數據結構, feof 是通過這個結構中的標志來判斷文件是否結束的.
          如果文件用 fgetc 讀取, 剛好把最后一個字符讀出時, fp 中的EOF標志不會打開,這時
          用feof判斷,將會得到文件尚未結束的結論.

          fgetc 返回 -1 時, 我們仍無法確信文件已經結束, 因為可能是讀取錯誤! 這時我們
          需要 feof 和 ferror.


          posted on 2010-11-29 16:22 WangShishuai 閱讀(386) 評論(0)  編輯  收藏 所屬分類: C language

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 石河子市| 云梦县| 洛川县| 永泰县| 嘉义市| 淮滨县| 东辽县| 灵武市| 湖口县| 来宾市| 富宁县| 玛沁县| 奈曼旗| 乌什县| 七台河市| 平阳县| 龙州县| 临武县| 汝阳县| 大洼县| 沁水县| 伊通| 黎平县| 金华市| 桃园市| 南江县| 徐州市| 黔南| 永城市| 新乐市| 正阳县| 甘南县| 新和县| 襄汾县| 蓬溪县| 丰台区| 上犹县| 宜昌市| 揭东县| 西安市| 深水埗区|