亂碼問題總算解決了
摘要: 昨天發了一下,新寫的GAE應用,得到了不少同學的關注。今晚再接再厲,把亂碼解決了。說一下解決的方法。
下面這段代碼用來獲取文章內容,并通過NekoHTML來解析獲得去掉HTML標簽的文章內容.標紅的地方就是用來設置字符集的,第一個是XML格式的字符集(似乎沒什么用),第二個地方是將字符串的內容通過輸入流讀入,如果不指定的話在GAE中默認的是ISO-8859-1(本地的話以設置的文件的字符類型為主),第三個地方是設置XML解析器的字符集。昨晚就是第二個地方沒有設置,導致亂碼。在測試的過程中還學到一點:GBK->ISO-8859-1 的過程是不可逆的,也就是說如果把中文字符轉成了ISO-8859-1的話,就再也轉不過來了,中文變成了"????"。因此在保險起見,輸入輸出流在使用的時候最好都加上字符集。
閱讀全文
posted @
2009-11-04 01:29 漁人 閱讀(582) |
評論 (0) 編輯