編碼問題
UTF8是可變長的編碼1?? UTF-8通過UNICODE轉 所以每次編碼都會變成最小
2?? 但解碼的時候仍然可以識別多種編碼
public class TestUTF8
{
?? public static void main(String [] args) throws Exception
?? {
????? ?byte[] bytes = {(byte)0xC0,(byte)0xB1};
?????? String str = new String(bytes,"UTF-8");(解碼)
?????? System.out.println(str.getBytes("UTF-8").length);(通過unicode編碼)
?? }
}
程序運行后打印的結果如下:
1
1
原因是
?
十六進制:C0 B1
二進制:11000000 10110001
對比兩個字節編碼的表示方式:
110xxxxx 10xxxxxx
提取出對應的UNICODE編碼:
00000 110001
抽象類和接口的區別
抽象類抽出象的部門?? 重在體現共同的部份?? 達到代碼復用
接口擴展功能?? 重在表現不同的部分?
posted on 2006-08-23 17:09 呂鵬 閱讀(127) 評論(0) 編輯 收藏 所屬分類: java技術心得