用正則表達式取出去除html頁面中的tags

          這個就比較簡單了,正則式是 “<[^>]*>”,其表意為“以<開頭的,后續任意個不為>的字符,并以>結尾的字符串”
          這樣做的目的是為了獲得所謂plain的文本,方便下一步的處理。

          代碼如下:

          1    /**
          2     * Remove all "<>" tags in the text
          3     * @param tagText
          4     * @return the clean text without tags
          5     */

          6    public String removeTags( String tagText )
          7    {
          8        return tagText.replaceAll("<[^>]*>""");
          9    }

          posted on 2009-11-06 22:19 甜菜侯爵 閱讀(203) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          <2009年11月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          導航

          統計

          常用鏈接

          留言簿

          隨筆檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 铜山县| 长春市| 德令哈市| 元阳县| 阜阳市| 定襄县| 醴陵市| 张北县| 确山县| 犍为县| 佛坪县| 黄平县| 甘肃省| 临沧市| 白朗县| 新源县| 马龙县| 西充县| 梓潼县| 松江区| 宁武县| 志丹县| 自贡市| 铁力市| 棋牌| 临沧市| 东宁县| 嘉义市| 乡城县| 南通市| 惠水县| 慈溪市| 望城县| 弋阳县| 华亭县| 姜堰市| 蒙城县| 夏邑县| 武陟县| 纳雍县| 湘阴县|