隨筆 - 23  文章 - 15  trackbacks - 0
          <2007年10月>
          30123456
          78910111213
          14151617181920
          21222324252627
          28293031123
          45678910



          留言簿(3)

          隨筆分類(19)

          搜索

          •  

          最新隨筆

          最新評論

          閱讀排行榜

          評論排行榜

          package search;

          import java.util.regex.Matcher;
          import java.util.regex.Pattern;
          /**
           * 功能:過濾標簽
           * 
          @author jiadong
           * 時間:2007年10月15日??
           * 版本:1.0?
           
          */

          public class HtmlTagsProcessor {
              
              
          public static String tagsProcessor(String inputString){
                  String processedString 
          = "" ;
                  Pattern js_pattern,style_pattern, html_pattern ,particular_pattern;
                  Matcher js_matcher,style_matcher,html_matcher,particular_matcher;
                  
                  
          //過濾js的正則表達式
                  String js_str = "<script.*>X*.*</script>X*";
                  
          //過濾樣式的正則表達式
                  String style_str = "<style.*>X*.*</style>X*";
                  
          //過濾html標簽的正則表達式
                  String html_str = "<[^>]+>" ;
                  String particular_str 
          = "&gt;|&amp;|&nbsp;|&quot;";
                  
                  
          //處理js標簽
                  js_pattern = Pattern.compile(js_str, Pattern.CASE_INSENSITIVE);
                  js_matcher 
          = js_pattern.matcher(inputString);
                  processedString 
          = js_matcher.replaceAll("");
                  
                  
          //處理樣式標簽
                  style_pattern = Pattern.compile(style_str, Pattern.CASE_INSENSITIVE);
                  style_matcher 
          = style_pattern.matcher(processedString);
                  processedString 
          = style_matcher.replaceAll("");
                  
                  
          //處理html標簽
                  html_pattern = Pattern.compile(html_str, Pattern.CASE_INSENSITIVE);
                  html_matcher 
          = html_pattern.matcher(processedString);
                  processedString 
          = html_matcher.replaceAll("");
                  
                  particular_pattern 
          = Pattern.compile(particular_str,Pattern.CASE_INSENSITIVE);
                  particular_matcher 
          = particular_pattern.matcher(processedString);
                  processedString 
          = particular_matcher.replaceAll("");
                  
          return processedString ;
              }

              
          }

          posted on 2007-10-17 11:32 jiadong 閱讀(408) 評論(0)  編輯  收藏 所屬分類: OTHERS
          主站蜘蛛池模板: 微博| 砚山县| 百色市| 临沧市| 长治县| 枣庄市| 瑞昌市| 尚志市| 东城区| 万年县| 阜平县| 手机| 灵宝市| 广丰县| 甘肃省| 陆丰市| 武强县| 民勤县| 东丰县| 宣汉县| 正定县| 天长市| 峨眉山市| 土默特左旗| 彩票| 浙江省| 湖口县| 北海市| 盐池县| 三原县| 迭部县| 乌鲁木齐县| 广西| 麟游县| 永善县| 康定县| 东乡县| 建阳市| 南投市| 会东县| 金坛市|