regexp很好很強大,不過一時半會沒時間看,不過總是要看的,先從.net用到的開始吧~
從網頁源碼中分析出 類似于 href=["|'] www.cc98.org/shop/index.asp["|'] 的東西
string pattern = "<a[^><]* href [\\s]* = [\\s]* ["|']? (?<urltext>([^\"'><\\s]+)) ["|']? [^>]* >"
Regex=new Regex(pattern,...)
請無視空格,沒有任何含義,只是方便閱讀.
以<a >為界, 我覺得應該要有明確的界,才能保證匹配速度.
VS的幫助文檔中有這些內容,花個2小時靜心看看,便知了
從網頁源碼中分析出 類似于 href=["|'] www.cc98.org/shop/index.asp["|'] 的東西
string pattern = "<a[^><]* href [\\s]* = [\\s]* ["|']? (?<urltext>([^\"'><\\s]+)) ["|']? [^>]* >"
Regex=new Regex(pattern,...)
請無視空格,沒有任何含義,只是方便閱讀.
以<a >為界, 我覺得應該要有明確的界,才能保證匹配速度.
VS的幫助文檔中有這些內容,花個2小時靜心看看,便知了