用正則表達(dá)式取出去除html頁(yè)面中的tags

          這個(gè)就比較簡(jiǎn)單了,正則式是 “<[^>]*>”,其表意為“以<開(kāi)頭的,后續(xù)任意個(gè)不為>的字符,并以>結(jié)尾的字符串”
          這樣做的目的是為了獲得所謂plain的文本,方便下一步的處理。

          代碼如下:

          1    /**
          2     * Remove all "<>" tags in the text
          3     * @param tagText
          4     * @return the clean text without tags
          5     */

          6    public String removeTags( String tagText )
          7    {
          8        return tagText.replaceAll("<[^>]*>""");
          9    }

          posted on 2009-11-06 22:19 甜菜侯爵 閱讀(202) 評(píng)論(0)  編輯  收藏


          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          <2009年11月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          導(dǎo)航

          統(tǒng)計(jì)

          常用鏈接

          留言簿

          隨筆檔案

          搜索

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          主站蜘蛛池模板: 绵阳市| 肃南| 阳东县| 孟州市| 工布江达县| 柳州市| 灵武市| 保靖县| 顺义区| 丹棱县| 阳曲县| 霸州市| 嘉义县| 萍乡市| 鹤岗市| 武穴市| 鄄城县| 巴青县| 大洼县| 河曲县| 宁阳县| 洞头县| 定边县| 云阳县| 阳信县| 临海市| 娱乐| 九龙城区| 抚顺市| 松潘县| 濮阳县| 库尔勒市| 哈巴河县| 青岛市| 黄骅市| 崇礼县| 南召县| 柏乡县| 田东县| 射洪县| 富宁县|