偷拍视屏一区,视频三区在线观看,一区二区三区高清在线观看

python中文處理辦法

Posted on 2008-10-09 21:46 leekiang 閱讀(1213) 評論(0) 編輯收藏所屬分類: python

用python處理字符串很容易，但是在處理中文的時候需要注意一些問題。
比如：

a = "我們是python愛好者"
print a[0]

只能輸出“我”字的前半部分，要想輸出整個的我字還需要

b = a[0:2]
print b

才行，很不方便，并且當一段文本中同時有中英文?氖焙蠔苣汛懟?
最好的辦法就是轉換為unicode。

像這樣：

c = unicode(a, "gb2312")
print c[0]

這個時候c的下標對應的就是每一字，不再是字節，并且通過 len(c) 就可以獲得字數！
還可以很方便的轉換為其他編碼，比如轉換為 utf-8

d = c.encode("utf-8")

轉自 http://www.okpython.com/bbs/viewthread.php?tid=311

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: ubuntu下django開發環境 python筆記 Trac筆記 python中文處理辦法 python+cx_Oracle 操作Oracle windows xp下搭建python+django開發環境的筆記

python中文處理辦法

公告

常用鏈接

留言簿(19)

隨筆分類(572)

隨筆檔案(536)

收藏

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜