2011年10月7日

          C下不用中間變量交換兩個變量值

           1 #include<stdio.h>
           2 
           3 void inplace_swap(int *int *);
           4 void main(){
           5     int a = 10;
           6     int b = 20;
           7     
           8     inplace_swap(&a, &b);
           9     system("pause");
          10 }
          11 
          12 void inplace_swap(int *x, int *y){
          13     *= *^ *y;
          14     printf("%d, %d\n"*x, *y);
          15     
          16     *= *^ *y;
          17     printf("%d, %d\n"*x, *y);
          18     
          19     *= *^ *y;    
          20     printf("%d, %d\n"*x, *y);
          21 }

          posted @ 2011-10-11 13:19 灰色客棧 閱讀(229) | 評論 (0)編輯 收藏

          Windows下使用命令行編譯鏈接運行C程序

          第一步,下載安裝DEV-CPP軟件;
          第二步,找到找到安裝目錄下的bin文件夾;
          步,bin文件夾目錄添加到Path系統變量中即配置成功;

          新建一個C程序源文件,設名字為hello.c

          第四步,開始->運行->輸入cmd回車,進入控制臺,進入源文件所在的目錄

          輸入命令gcc hello.c -g -o xxx,xxx即為編譯連接后可運行的文件名
          敲擊回車鍵后,就可以運行編譯后得程序:xxx.exe
          在命令行中敲入xxx即可運行C程序獲得運行結果。

          在運行中很可能出現屏幕一閃而過的現象,這時候只要在程序的最后加上語句:system("pause");即可解決

          posted @ 2011-10-10 23:51 灰色客棧 閱讀(881) | 評論 (0)編輯 收藏

          字符編碼

          轉自:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html   原作者:
          阮一峰

          今天中午,我突然想搞清楚Unicode和UTF-8之間的關系,于是就開始在網上查資料。

          結果,這個問題比我想象的復雜,從午飯后一直看到晚上9點,才算初步搞清楚。

          下面就是我的筆記,主要用來整理自己的思路。但是,我盡量試圖寫得通俗易懂,希望能對其他朋友有用。畢竟,字符編碼是計算機技術的基石,想要熟練使用計算機,就必須懂得一點字符編碼的知識。

          1. ASCII碼

          我們知道,在計算機內部,所有的信息最終都表示為一個二進制的字符串。每一個二進制位(bit)有0和1兩種狀態,因此八個二進制位就可以組合出256種狀態,這被稱為一個字節(byte)。也就是說,一個字節一共可以用來表示256種不同的狀態,每一個狀態對應一個符號,就是256個符號,從0000000到11111111。

          上個世紀60年代,美國制定了一套字符編碼,對英語字符與二進制位之間的關系,做了統一規定。這被稱為ASCII碼,一直沿用至今。

          ASCII碼一共規定了128個字符的編碼,比如空格“SPACE”是32(二進制00100000),大寫的字母A是65(二進制01000001)。這128個符號(包括32個不能打印出來的控制符號),只占用了一個字節的后面7位,最前面的1位統一規定為0。

          2、非ASCII編碼

          英語用128個符號編碼就夠了,但是用來表示其他語言,128個符號是不夠的。比如,在法語中,字母上方有注音符號,它就無法用ASCII碼表示。于是,一些歐洲國家就決定,利用字節中閑置的最高位編入新的符號。比如,法語中的é的編碼為130(二進制10000010)。這樣一來,這些歐洲國家使用的編碼體系,可以表示最多256個符號。

          但是,這里又出現了新的問題。不同的國家有不同的字母,因此,哪怕它們都使用256個符號的編碼方式,代表的字母卻不一樣。比如,130在法語編碼中代表了é,在希伯來語編碼中卻代表了字母Gimel (?),在俄語編碼中又會代表另一個符號。但是不管怎樣,所有這些編碼方式中,0—127表示的符號是一樣的,不一樣的只是128—255的這一段。

          至于亞洲國家的文字,使用的符號就更多了,漢字就多達10萬左右。一個字節只能表示256種符號,肯定是不夠的,就必須使用多個字節表達一個符號。比如,簡體中文常見的編碼方式是GB2312,使用兩個字節表示一個漢字,所以理論上最多可以表示256x256=65536個符號。

          中文編碼的問題需要專文討論,這篇筆記不涉及。這里只指出,雖然都是用多個字節表示一個符號,但是GB類的漢字編碼與后文的Unicode和UTF-8是毫無關系的。

          3.Unicode

          正如上一節所說,世界上存在著多種編碼方式,同一個二進制數字可以被解釋成不同的符號。因此,要想打開一個文本文件,就必須知道它的編碼方式,否則用錯誤的編碼方式解讀,就會出現亂碼。為什么電子郵件常常出現亂碼?就是因為發信人和收信人使用的編碼方式不一樣。

          可以想象,如果有一種編碼,將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼,那么亂碼問題就會消失。這就是Unicode,就像它的名字都表示的,這是一種所有符號的編碼。

          Unicode當然是一個很大的集合,現在的規模可以容納100多萬個符號。每個符號的編碼都不一樣,比如,U+0639表示阿拉伯字母Ain,U+0041表示英語的大寫字母A,U+4E25表示漢字“嚴”。具體的符號對應表,可以查詢unicode.org,或者專門的漢字對應表。

          4. Unicode的問題

          需要注意的是,Unicode只是一個符號集,它只規定了符號的二進制代碼,卻沒有規定這個二進制代碼應該如何存儲。

          比如,漢字“嚴”的unicode是十六進制數4E25,轉換成二進制數足足有15位(100111000100101),也就是說這個符號的表示至少需要2個字節。表示其他更大的符號,可能需要3個字節或者4個字節,甚至更多。

          這里就有兩個嚴重的問題,第一個問題是,如何才能區別unicode和ascii?計算機怎么知道三個字節表示一個符號,而不是分別表示三個符號呢?第二個問題是,我們已經知道,英文字母只用一個字節表示就夠了,如果unicode統一規定,每個符號用三個或四個字節表示,那么每個英文字母前都必然有二到三個字節是0,這對于存儲來說是極大的浪費,文本文件的大小會因此大出二三倍,這是無法接受的。

          它們造成的結果是:1)出現了unicode的多種存儲方式,也就是說有許多種不同的二進制格式,可以用來表示unicode。2)unicode在很長一段時間內無法推廣,直到互聯網的出現。

          5.UTF-8

          互聯網的普及,強烈要求出現一種統一的編碼方式。UTF-8就是在互聯網上使用最廣的一種unicode的實現方式。其他實現方式還包括UTF-16和UTF-32,不過在互聯網上基本不用。重復一遍,這里的關系是,UTF-8是Unicode的實現方式之一。

          UTF-8最大的一個特點,就是它是一種變長的編碼方式。它可以使用1~4個字節表示一個符號,根據不同的符號而變化字節長度。

          UTF-8的編碼規則很簡單,只有二條:

          1)對于單字節的符號,字節的第一位設為0,后面7位為這個符號的unicode碼。因此對于英語字母,UTF-8編碼和ASCII碼是相同的。

          2)對于n字節的符號(n>1),第一個字節的前n位都設為1,第n+1位設為0,后面字節的前兩位一律設為10。剩下的沒有提及的二進制位,全部為這個符號的unicode碼。

          下表總結了編碼規則,字母x表示可用編碼的位。

          Unicode符號范圍 | UTF-8編碼方式
          (十六進制) | (二進制)
          --------------------+---------------------------------------------
          0000 0000-0000 007F | 0xxxxxxx
          0000 0080-0000 07FF | 110xxxxx 10xxxxxx
          0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
          0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

          下面,還是以漢字“嚴”為例,演示如何實現UTF-8編碼。

          已知“嚴”的unicode是4E25(100111000100101),根據上表,可以發現4E25處在第三行的范圍內(0000 0800-0000 FFFF),因此“嚴”的UTF-8編碼需要三個字節,即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后,從“嚴”的最后一個二進制位開始,依次從后向前填入格式中的x,多出的位補0。這樣就得到了,“嚴”的UTF-8編碼是“11100100 10111000 10100101”,轉換成十六進制就是E4B8A5。

          6. Unicode與UTF-8之間的轉換

          通過上一節的例子,可以看到“嚴”的Unicode碼是4E25,UTF-8編碼是E4B8A5,兩者是不一樣的。它們之間的轉換可以通過程序實現。

          在Windows平臺下,有一個最簡單的轉化方法,就是使用內置的記事本小程序Notepad.exe。打開文件后,點擊“文件”菜單中的“另存為”命令,會跳出一個對話框,在最底部有一個“編碼”的下拉條。

          bg2007102801.jpg

          里面有四個選項:ANSI,Unicode,Unicode big endian 和 UTF-8。

          1)ANSI是默認的編碼方式。對于英文文件是ASCII編碼,對于簡體中文文件是GB2312編碼(只針對Windows簡體中文版,如果是繁體中文版會采用Big5碼)。

          2)Unicode編碼指的是UCS-2編碼方式,即直接用兩個字節存入字符的Unicode碼。這個選項用的little endian格式。

          3)Unicode big endian編碼與上一個選項相對應。我在下一節會解釋little endian和big endian的涵義。

          4)UTF-8編碼,也就是上一節談到的編碼方法。

          選擇完”編碼方式“后,點擊”保存“按鈕,文件的編碼方式就立刻轉換好了。

          7. Little endian和Big endian

          上一節已經提到,Unicode碼可以采用UCS-2格式直接存儲。以漢字”嚴“為例,Unicode碼是4E25,需要用兩個字節存儲,一個字節是4E,另一個字節是25。存儲的時候,4E在前,25在后,就是Big endian方式;25在前,4E在后,就是Little endian方式。

          這兩個古怪的名稱來自英國作家斯威夫特的《格列佛游記》。在該書中,小人國里爆發了內戰,戰爭起因是人們爭論,吃雞蛋時究竟是從大頭(Big-Endian)敲開還是從小頭(Little-Endian)敲開。為了這件事情,前后爆發了六次戰爭,一個皇帝送了命,另一個皇帝丟了王位。

          因此,第一個字節在前,就是”大頭方式“(Big endian),第二個字節在前就是”小頭方式“(Little endian)。

          那么很自然的,就會出現一個問題:計算機怎么知道某一個文件到底采用哪一種方式編碼?

          Unicode規范中定義,每一個文件的最前面分別加入一個表示編碼順序的字符,這個字符的名字叫做”零寬度非換行空格“(ZERO WIDTH NO-BREAK SPACE),用FEFF表示。這正好是兩個字節,而且FF比FE大1。

          如果一個文本文件的頭兩個字節是FE FF,就表示該文件采用大頭方式;如果頭兩個字節是FF FE,就表示該文件采用小頭方式。

          8. 實例

          下面,舉一個實例。

          打開”記事本“程序Notepad.exe,新建一個文本文件,內容就是一個”嚴“字,依次采用ANSI,Unicode,Unicode big endian 和 UTF-8編碼方式保存。

          然后,用文本編輯軟件UltraEdit中的”十六進制功能“,觀察該文件的內部編碼方式。

          1)ANSI:文件的編碼就是兩個字節“D1 CF”,這正是“嚴”的GB2312編碼,這也暗示GB2312是采用大頭方式存儲的。

          2)Unicode:編碼是四個字節“FF FE 25 4E”,其中“FF FE”表明是小頭方式存儲,真正的編碼是4E25。

          3)Unicode big endian:編碼是四個字節“FE FF 4E 25”,其中“FE FF”表明是大頭方式存儲。

          4)UTF-8:編碼是六個字節“EF BB BF E4 B8 A5”,前三個字節“EF BB BF”表示這是UTF-8編碼,后三個“E4B8A5”就是“嚴”的具體編碼,它的存儲順序與編碼順序是一致的。

          posted @ 2011-10-10 20:13 灰色客棧 閱讀(281) | 評論 (0)編輯 收藏

          Java中的一個有趣實驗

          一直很想試驗一下對象創建時候兩個類循環調用會用什么后果,今天做了一下,果然和想象的一下,下面貼出自己的實驗代碼:

          實驗中總共需要三個類:
          第一個類:
          1 public class Test_A {
          2     public Test_A(){
          3     Test_B b = new Test_B();
          4     System.out.println("A is created!");
          5     }
          6 }

          第二個類:
          1 public class Test_B {
          2     public Test_B(){
          3     Test_A b = new Test_A();
          4     System.out.println("B is created!");
          5     }
          6 }
          上面兩個類在實例化的時候都需要實例化對方,也就說這里形成了循環調用,下面看看測試類:
          1 public class Test {
          2     public static void main(String[] args) {
          3     // TODO Auto-generated method stub
          4     Test_A a = new Test_A();
          5     }
          6 }
          大家現在可以猜一猜實驗運行結果(昨天看到一片帖子也是說這個問題的,當時有人說不會出現循環調用)

          一下是在Eclipse中的實驗結果:
          Exception in thread "main" java.lang.StackOverflowError
                  at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
              at Test_A.
          <init>(Test_A.java:4)
              at Test_B.
          <init>(Test_B.java:4)
          整個輸出窗口全部被占滿

          和預期的一樣,真的產生了循環調用,并且出現了棧溢出異常!!

          posted @ 2011-10-10 10:45 灰色客棧 閱讀(373) | 評論 (0)編輯 收藏

          Java實現簡單的List

          節點代碼:
           1 //定義數據結構
           2 public class LinkNode {
           3     int value;
           4     LinkNode next;
           5     
           6     public LinkNode(int value){
           7     this.value = value;
           8     }
           9
           }
          以上是定義的鏈表節點,可以在新建節點的時候賦值

          鏈表節點:
          public class MyList {
              
          //定義首節點
              LinkNode first;
              
              
          //定義尾節點
              LinkNode last;
              
              
          //定義長度
              int length = 0;
              
              
          public MyList(){
              first 
          = null;
              last 
          = null;
              }
              
              
          public MyList(LinkNode node){
              first 
          = node;
              last 
          = node;
              length
          ++;
              }
              
              
          //添加節點
              public void addNode(LinkNode node){
              
          if(first == null){
                  first 
          = node;
                  length 
          = 1;
              }
              
          else{
                  last.next 
          = node;
                  last 
          = node;
                  length
          ++;
              }
              }
              
              
          //刪除指定節點:遍歷鏈表,將遇到的第一個和指定節點相同的節點刪去
              public void deleteNode(LinkNode node){
              
          if(first == null){
                  
          return;
              }
                  
              
          else if(first.value == node.value){
                  first 
          = first.next;
                  length
          --;
              }
              
          else{
                  
          //如果鏈表不為空,要刪除也不是第一個
                  LinkNode temp;
                  System.out.println(node.value);
                  
          for(temp = first; temp != null ;temp = temp.next){
                  
          if(temp.next.value == node.value){
                      
          //如果下一個就是最后一個
                      if(temp.next.equals(last)){
                      last 
          = temp;
                      length
          --;
                      
          return;
                      }
                      length
          --;
                      temp.next 
          = temp.next.next;
                      
          return;
                  }
                  }
              }
              }
              
              
          public int getLength(){
              
          return length;
              }
          }
          以上是鏈表的具體實現,這里只實現了很簡單的三個功能:添加節點,刪除指定節點,獲取鏈表長度。

          接下來是測試代碼:

          public class Test {
              
          public static void main(String[] args) {
              LinkNode node 
          = new LinkNode(3);
              
              MyList list 
          = new MyList(node);
              
              list.addNode(
          new LinkNode(3));
              list.addNode(
          new LinkNode(6));
              list.addNode(
          new LinkNode(4));
              list.addNode(
          new LinkNode(7));
              list.addNode(
          new LinkNode(2));
              
              listDisplay(list);
              
              list.deleteNode(
          new LinkNode(3));
              listDisplay(list);
              }
              
              
          public static void listDisplay(MyList list){
              
          int i = 0;
              
          int length = list.getLength();
              LinkNode temp;
              
          for(temp = list.first; i < length; temp = temp.next, i++){
                  System.out.print(temp.value 
          + " ");
              }
              System.out.println();
              }
          }
          以下是輸出結果:
          3 3 6 4 7 2 
          3 6 4 7 2 

          程序有待改善的地方:
          1.完善鏈表功能,比如插入功能(和添加什么的大同小異);
          2.加強功能實現,可以通過一定的手段消除First的特殊性,使得實現更加簡單;
          3.可以使用泛型,是的鏈表的存儲不局限于Integer類型;

          posted @ 2011-10-10 10:29 灰色客棧 閱讀(607) | 評論 (0)編輯 收藏

          Android之Uri

               摘要: 一、Uri的含義在Android中,為了使用數據集中管理模式,使用了ContentProvider來進行數據管理,在使用ContentProvider進行數據交互時就需要用到Uri。為了讓客戶端程序能夠使用你的數據,你必須要定義一個公開的Uri,它由一些固定格式的文字組成,可以分成下面幾個部分:   A: schema,表達的意思是使用ContentProvider來...  閱讀全文

          posted @ 2011-10-07 19:31 灰色客棧 閱讀(2559) | 評論 (0)編輯 收藏

          <2011年10月>
          2526272829301
          2345678
          9101112131415
          16171819202122
          23242526272829
          303112345

          導航

          統計

          常用鏈接

          留言簿

          隨筆檔案

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 伽师县| 靖宇县| 宜宾市| 成都市| 合阳县| 新化县| 连州市| 南和县| 沅陵县| 永善县| 壶关县| 岳西县| 黄平县| 青海省| 广饶县| 芜湖县| 沈阳市| 秦安县| 庆阳市| 合川市| 尉氏县| 岱山县| 莱芜市| 武川县| 灵寿县| 普安县| 麟游县| 将乐县| 镇安县| 五常市| 中宁县| 山阴县| 达州市| 葫芦岛市| 水城县| 宜君县| 泊头市| 衢州市| 合川市| 五家渠市| 丰原市|