posts - 32,  comments - 3,  trackbacks - 0

          發(fā)現(xiàn)現(xiàn)在幾乎所有的網(wǎng)站都對url中的漢字和特殊的字符,進行了urlencode操作,也就是:

          http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/blog/

          這個樣子,中間%形式的,肯定就是我的登錄用戶名稱了吧。

          為什么對這些字符進行了u的編碼形式,是為了字符編碼(gbk、utf8)還是為了不出現(xiàn)特殊的字符在url中?都知道要轉,但是轉了的真正好處呢。查看了網(wǎng)上的很多資料,也沒有找到更加準確的說法。

          url轉義其實也只是為了符合url的規(guī)范而已。因為在標準的url規(guī)范中中文和很多的字符是不允許出現(xiàn)在url中的。

          看一下php的urlencode的說明了。

          urlencode — 編碼 URL 字符串

          string urlencode ( string $str )

          返回字符串,此字符串中除了 -_. 之外的所有非字母數(shù)字字符都將被替換成百分號(%)后跟兩位十六進制數(shù),空格則編碼為加號(+)。此編碼與 WWW 表單 POST 數(shù)據(jù)的編碼方式是一樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣。由于歷史原因,此編碼在將空格編碼為加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。此函數(shù)便于將字符串編碼并將其用于 URL 的請求部分,同時它還便于將變量傳遞給下一頁。

          標準的英文說明是:

          "...Only alphanumerics [0-9a-zA-Z], the special characters "$-_.+!*'()," [not including the quotes - ed], and reserved characters used for their reserved purposes may be used unencoded within a URL."

          那哪些字符是需要轉化的呢?

          1. ASCII 的控制字符

          這些字符都是不可打印的,自然需要進行轉化。

          2. 一些非ASCII字符

          這些字符自然是非法的字符范圍。轉化也是理所當然的了。

          3. 一些保留字符

          很明顯最常見的就是“&”了,這個如果出現(xiàn)在url中了,那你認為是url中的一個字符呢,還是特殊的參數(shù)分割用的呢?

          4. 就是一些不安全的字符了。

          例如:空格。為了防止引起歧義,需要被轉化為“+”。

          明白了這些,也就知道了為什么需要轉化了,而轉化的規(guī)則也是很簡單的。

          按照每個字符對應的字符編碼,不是符合我們范圍的,統(tǒng)統(tǒng)的轉化為%的形式也就是了。自然也是16進制的形式。

          和字符編碼無關

          通過urlencode的轉化規(guī)則和目的,我們也很容易的看出,urleocode是基于字符編碼的。同樣的一個漢字,不同的編碼類型,肯定對應不同的urleocode的串。gbk編碼的有gbk的encode結果。

          apache等服務器,接受到字符串后,可以進行decode,但是還是無法解決編碼的問題。編碼問題,還是需要靠約定或者字符編碼的判斷解決。

          因此,urleocode只是為了url中一些非ascii字符,可以正確無誤的被傳輸,至于使用哪種編碼,就不是eocode所關心和解決的問題了。

          編碼問題,不是urlencode所要解決的。
          轉自:http://apps.hi.baidu.com/share/detail/32230450

          參考資料:

          http://www.blooberry.com/indexdot/html/topics/urlencoding.htm

          http://cn.php.net/manual/zh/function.urlencode.php

           

           

           

          posted on 2011-08-10 13:16 donghang73 閱讀(10428) 評論(0)  編輯  收藏 所屬分類: 學習筆記
          主站蜘蛛池模板: 班戈县| 莆田市| 前郭尔| 永吉县| 铜梁县| 五寨县| 蕉岭县| 新田县| 上思县| 六盘水市| 邯郸市| 桂平市| 迭部县| 靖边县| 连南| 彰化市| 新疆| 岳阳县| 仁化县| 上虞市| 澳门| 铜川市| 伊宁市| 普兰县| 攀枝花市| 开封县| 武邑县| 柳江县| 翁牛特旗| 高台县| 宿州市| 深圳市| 双江| 高邮市| 台前县| 黑水县| 兴仁县| 思茅市| 乃东县| 息烽县| 马龙县|