隨筆 - 23  文章 - 15  trackbacks - 0
          <2007年10月>
          30123456
          78910111213
          14151617181920
          21222324252627
          28293031123
          45678910



          留言簿(3)

          隨筆分類(19)

          搜索

          •  

          最新隨筆

          最新評論

          閱讀排行榜

          評論排行榜

          package search;

          import java.util.regex.Matcher;
          import java.util.regex.Pattern;
          /**
           * 功能:過濾標簽
           * 
          @author jiadong
           * 時間:2007年10月15日??
           * 版本:1.0?
           
          */

          public class HtmlTagsProcessor {
              
              
          public static String tagsProcessor(String inputString){
                  String processedString 
          = "" ;
                  Pattern js_pattern,style_pattern, html_pattern ,particular_pattern;
                  Matcher js_matcher,style_matcher,html_matcher,particular_matcher;
                  
                  
          //過濾js的正則表達式
                  String js_str = "<script.*>X*.*</script>X*";
                  
          //過濾樣式的正則表達式
                  String style_str = "<style.*>X*.*</style>X*";
                  
          //過濾html標簽的正則表達式
                  String html_str = "<[^>]+>" ;
                  String particular_str 
          = "&gt;|&amp;|&nbsp;|&quot;";
                  
                  
          //處理js標簽
                  js_pattern = Pattern.compile(js_str, Pattern.CASE_INSENSITIVE);
                  js_matcher 
          = js_pattern.matcher(inputString);
                  processedString 
          = js_matcher.replaceAll("");
                  
                  
          //處理樣式標簽
                  style_pattern = Pattern.compile(style_str, Pattern.CASE_INSENSITIVE);
                  style_matcher 
          = style_pattern.matcher(processedString);
                  processedString 
          = style_matcher.replaceAll("");
                  
                  
          //處理html標簽
                  html_pattern = Pattern.compile(html_str, Pattern.CASE_INSENSITIVE);
                  html_matcher 
          = html_pattern.matcher(processedString);
                  processedString 
          = html_matcher.replaceAll("");
                  
                  particular_pattern 
          = Pattern.compile(particular_str,Pattern.CASE_INSENSITIVE);
                  particular_matcher 
          = particular_pattern.matcher(processedString);
                  processedString 
          = particular_matcher.replaceAll("");
                  
          return processedString ;
              }

              
          }

          posted on 2007-10-17 11:32 jiadong 閱讀(408) 評論(0)  編輯  收藏 所屬分類: OTHERS
          主站蜘蛛池模板: 宿迁市| 大化| 定兴县| 大同市| 富顺县| 内乡县| 漠河县| 迁安市| 潞城市| 梁山县| 奈曼旗| 监利县| 定兴县| 西盟| 黄骅市| 汉寿县| 松潘县| 泸溪县| 岚皋县| 竹溪县| 岳普湖县| 枣强县| 牙克石市| 惠东县| 酒泉市| 汾西县| 青河县| 平谷区| 梨树县| 汕头市| 微博| 太仆寺旗| 浦东新区| 右玉县| 容城县| 麟游县| 华容县| 枝江市| 辽宁省| 庆城县| 文登市|