??xml version="1.0" encoding="utf-8" standalone="yes"?>在线中文视频,粉嫩一区二区三区,在线观看亚洲精品福利片http://www.aygfsteel.com/ibmsoft/ibmsoft 努力不一定成?攑ּ一定失? 坚持自己的理?实现自己的目? 有好的想法就要出惛_法实?zh-cnTue, 06 May 2025 16:04:09 GMTTue, 06 May 2025 16:04:09 GMT60appfuse 再学习!http://www.aygfsteel.com/ibmsoft/archive/2006/08/11/63038.htmlibmsoftibmsoftFri, 11 Aug 2006 08:44:00 GMThttp://www.aygfsteel.com/ibmsoft/archive/2006/08/11/63038.htmlhttp://www.aygfsteel.com/ibmsoft/comments/63038.htmlhttp://www.aygfsteel.com/ibmsoft/archive/2006/08/11/63038.html#Feedback0http://www.aygfsteel.com/ibmsoft/comments/commentRss/63038.htmlhttp://www.aygfsteel.com/ibmsoft/services/trackbacks/63038.html
用最新的appfuse1.9.3版本Q?br />
?http"://appfuse.org/下蝲appfuse1.93

用idea打开
只需要修改properties.xml中的
    <!-- Defaults for database.properties -->
    
<property name="database.jar" location="${mysql.jar}"/>
    
<property name="database.type" value="mysql"/>
    
<property name="database.name" value="appfuse"/>
    
<property name="database.host" value="localhost"/>
    
<property name="database.username" value="root"/>
    
<property name="database.password" value="root"/>

把其中的localhost修改成实际的ipok?br />比如说是Q?92.169.0.1:3306Q注意一定要加上端口P

然后在ant中运行相关的dQ?br />我这里的情况是:
建数据库表和数据的不走是
q行 dbQprepareQ-》dbQcreateQ-》dbQloadQ这h据就Z?br />
然后deployQ在ie中运行appfuseok了!


ibmsoft 2006-08-11 16:44 发表评论
]]>
use google or baidu get the useful urlhttp://www.aygfsteel.com/ibmsoft/archive/2006/07/25/60029.htmlibmsoftibmsoftTue, 25 Jul 2006 09:26:00 GMThttp://www.aygfsteel.com/ibmsoft/archive/2006/07/25/60029.htmlhttp://www.aygfsteel.com/ibmsoft/comments/60029.htmlhttp://www.aygfsteel.com/ibmsoft/archive/2006/07/25/60029.html#Feedback0http://www.aygfsteel.com/ibmsoft/comments/commentRss/60029.htmlhttp://www.aygfsteel.com/ibmsoft/services/trackbacks/60029.html  1 /*
 2  * Copyright (c) 2006 Your Corporation. All Rights Reserved.
 3  */
 4 package liuxuan;
 5 
 6 /**
 7  * Created by IntelliJ IDEA.
 8  * User: Administrator
 9  * Date: 2006-7-26
10  * Time: 15:33:49
11  * To change this template use File | Settings | File Templates.
12  */
13 import org.htmlparser.Node;
14 import org.htmlparser.Parser;
15 import org.htmlparser.http.ConnectionManager;
16 import org.htmlparser.tags.LinkTag;
17 import org.htmlparser.util.ParserException;
18 import org.htmlparser.visitors.ObjectFindingVisitor;
19 
20 import java.sql.Statement;
21 import java.sql.DriverManager;
22 import java.sql.Connection;
23 import java.sql.SQLException;
24 
25 public class LinkDemo
26 {
27     public static void main (String[] args) throws ParserException, SQLException
28     {
29         ConnectionManager cn = new ConnectionManager();
30         cn.setProxyHost("10.75.1.38");
31         cn.setProxyPort(80);
32         Parser.setConnectionManager(cn);
33         Parser parser;
34         //parser.s
35         String[] pyurl = new String[2] ;
36 
37         pyurl[0]="http://www.google.cn/search?num=100&hl=zh-CN&newwindow=1&q=%E6%BF%AE%E9%98%B3&btnG=%E6%90%9C%E7%B4%A2&meta=cr%3DcountryCN";
38         pyurl[1]="http://www.google.cn/search?q=%E6%BF%AE%E9%98%B3&num=100&hl=zh-CN&lr=&cr=countryCN&newwindow=1&start=100&sa=N";
39         for (int j=0;j<pyurl.length;j++) {
40             parser = new Parser (pyurl[j]);
41             ObjectFindingVisitor visitor = new ObjectFindingVisitor (LinkTag.class);
42             parser.visitAllNodesWith (visitor);
43             Node[] links = visitor.getTags ();
44             String sql;
45                 try {
46                         Class.forName("com.mysql.jdbc.Driver");
47                     } catch (ClassNotFoundException e) {
48                         e.printStackTrace();  //To change body of catch statement use File | Settings | File Templates.
49                     }
50                     Connection conn = null;
51                     try {
52                         conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/crawdb""root""root");
53                     } catch (SQLException e) {
54                         e.printStackTrace();  //To change body of catch statement use File | Settings | File Templates.
55                     }
56              Statement stmt = conn.createStatement();
57             for (int i = 0; i < links.length; i++)
58             {
59                     sql="";
60                 LinkTag linkTag = (LinkTag)links[i];
61                 if (linkTag.getLink().indexOf("cache")<0 &&  linkTag.getLink().indexOf("google")<0 &&linkTag.getLinkText().indexOf("Ȯ阳")>0)  {
62 
63 
64                       sql="insert into urls(name,note,url) values('"+linkTag.getLinkText ()+"','"+"lixuan"+"','"+linkTag.getLink ()+"')";
65                       stmt.executeUpdate(sql);
66                         //rs.close();
67 
68                     System.out.print ("\"" + linkTag.getLinkText () + "\" => ");
69                 System.out.println (linkTag.getLink ());
70                 }
71             }
72              stmt.close();
73              conn.close();
74         }
75     }
76 
77 }
78 


ibmsoft 2006-07-25 17:26 发表评论
]]>
Nutch Cache Page picture problemhttp://www.aygfsteel.com/ibmsoft/archive/2006/06/28/55609.htmlibmsoftibmsoftWed, 28 Jun 2006 13:03:00 GMThttp://www.aygfsteel.com/ibmsoft/archive/2006/06/28/55609.htmlhttp://www.aygfsteel.com/ibmsoft/comments/55609.htmlhttp://www.aygfsteel.com/ibmsoft/archive/2006/06/28/55609.html#Feedback0http://www.aygfsteel.com/ibmsoft/comments/commentRss/55609.htmlhttp://www.aygfsteel.com/ibmsoft/services/trackbacks/55609.html
  • I use nutch to crawl the intranet.but you know ,the cache.jsp have mang problem (X).Because I filter the gif|jgf and so on
    then I use ORO replace the html content use my customer pif
    Code:
     1    String sRegexpSrc="src\\s*=\\s*\"([\\.]*)/([a-z]*)/([^\"]+)";
     2    String sRegxpBackground ="background\\s*=\\s*\"([.]*)/([a-z]*)/([^\"]+)";
     3    String sAdd = "";
     4    String sNewContent="";
     5    PatternCompiler compiler = new Perl5Compiler();
     6    Pattern pattern = null,pattern1 = null ;
     7    try{
     8        pattern = compiler.compile(sRegexpSrc,Perl5Compiler.CASE_INSENSITIVE_MASK);
     9        pattern1 = compiler.compile(sRegxpBackground,Perl5Compiler.CASE_INSENSITIVE_MASK);
    10    }
    catch (MalformedPatternException e){
    11        
    12        e.printStackTrace();
    13    }

    14    PatternMatcher matcher = new Perl5Matcher();
    15
    16if (matcher.contains(content, pattern)){
    17                    MatchResult result = matcher.getMatch();
    18                    //System.out.println(result.toString());
    19                    sAdd = result.group(1)+"/"+result.group(2)+"/"+result.group(3);
    20                    //System.out.println("sAdd= "+sAdd);
    21                    sNewContent=content.replaceAll(sAdd,"\\img\\liuxuan");
    22                    //System.out.println("FinalString="+sTest.replaceAll(sAdd,"/img/liuxuan.png"));
    23            //System.out.print("sTest= "+result.group(1)+"/"+result.group(2));
    24        }
    else{
    25            //System.out.print("Can't find the String ");
    26
    27        }



  • ibmsoft 2006-06-28 21:03 发表评论
    ]]>
    Java实现利用搜烦引擎攉|址的程?/title><link>http://www.aygfsteel.com/ibmsoft/archive/2006/06/14/52834.html</link><dc:creator>ibmsoft</dc:creator><author>ibmsoft</author><pubDate>Wed, 14 Jun 2006 11:50:00 GMT</pubDate><guid>http://www.aygfsteel.com/ibmsoft/archive/2006/06/14/52834.html</guid><wfw:comment>http://www.aygfsteel.com/ibmsoft/comments/52834.html</wfw:comment><comments>http://www.aygfsteel.com/ibmsoft/archive/2006/06/14/52834.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.aygfsteel.com/ibmsoft/comments/commentRss/52834.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/ibmsoft/services/trackbacks/52834.html</trackback:ping><description><![CDATA[ <table class="blueBox" border="0"> <tbody> <tr> <td width="558"> <div id="wmqeeuq" class="mainbody"> <div id="wmqeeuq" class="blogpost partsmb" id="rtebox" style="PADDING-RIGHT: 0px; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; MARGIN: 0px; PADDING-TOP: 0px"> <div id="wmqeeuq" class="MSN_EDITCONTAINER"> </div> </div> </div> </td> </tr> <tr> <td style="BORDER-RIGHT: rgb(232,232,232) 1px solid; BORDER-LEFT: rgb(232,232,232) 1px solid" align="middle" bgcolor="#f9f9f9" colspan="3"> <table cellspacing="0" cellpadding="0" width="700" align="center" border="0"> <tbody> <tr bgcolor="#f9f9f9"> <td style="LINE-HEIGHT: 200%"> <p>我这里讲的不是怎么使用搜烦引擎Q而是怎么让程序利用搜索引擎来搜集|址Q这有什么用Q很有用Q网上动辄有人叫卖网址数据库,如发布Y件网址、邮件地址、论坛网址、行业网址Q这些网址是怎么来的呢?不可能是人手工收集而来的,都是让程序利用搜索引擎取到的Q如果您需要某cȝ址信息数据Q就跟我来一LI一下,非常单?/p> <p>  本文采用Java语言写成Q以google和百度搜索引擎ؓ对象?/p> <p>  我们要利用google、百度搜索引擎的搜烦规则中的两条Q关键字搜烦和inurl搜烦。什么是inurl搜烦Q就是你所要搜索的|址中本w带有的关键字,比如http://www.xxx.com/post.asp ,q个|址含有post.aspq样的关键字Q在搜烦引擎中填写规则是 inurl:post.asp,q是攉|址的关键,因ؓ很多|址本n会带有特定的信息Q比如Y件发布的|页|址信息中多含有 publish、submit、tuijianq样的信息,如http://www.xxx.com/publish.asp,q样的网址多是发布信息的网,在结合网中本n可能含有的关键字Q就可以用搜索引擎搜索出l果Q然后我们利用程序将l果取回Q对HTML面q行分析Q去除没有用的信息,有用的|址信息写入文g或者数据库Q就可以l其它应用程序或者h来用了?/p> <p>  W一步,用程序将搜烦l果取回Q先以百度ؓ例,比如我们要搜索Y件发布的|页Q关键字采用 “Y件发?版本 inurl:publish.asp",先登录百度看看,关键字写入Q然后提交,在地址栏就会看?http://www.baidu.com/s?ie=gb2312&bs=%C8%ED%BC%FE%B7%A2%B2%BC+%C8%ED%BC%FE%B0%E6%B1%BE+inurl%3Apublish.asp&sr=&z=&cl=3&f=8&wd=%C8%ED%BC%FE%B7%A2%B2%BC+%B0%E6%B1%BE+inurl%3Apublish.asp&ct=0 ,中文关键字全都变成编码了Q没有关p,我们在程序中直接用中文也是可以的Q其中多个关键字用+Lq,L一些没有用的信息,我们可以把地址优化?http://www.baidu.com/s?lm=0&si=&rn=20&ie=gb2312&ct=0& wd=软g发布+版本+inurl%3Apublish%2Easp&pn=0&cl=0Q其中rn表示一|C多个l果Qwd=表示你要搜烦的关键字Qpn表示从第几条开始显C,q个pn是我们E序循环取结果的变量Q每20条@环一ơ。我们用Java写的E序来模拟这个搜索的q程Q用到的关键cMؓ java.net.HttpURLConnection,java.net.URLQ先写一个提交搜索的class,关键代码如下Q?/p> <p>class Search<br />{<br /> public URL url;<br /> public HttpURLConnection http;<br /> public java.io.InputStream urlstream;<br /> ......<br /> for(int i=0;i++;i <100)<br /> {<br />  ......<br />  try {<br />   url = new URL("www.baidu.com/s?lm=0&si=&rn=20&ie=gb2312&ct=0& wd=软g发布+版本+inurl%3Apublish%2Easp&pn="+beginrecord+"&cl=0");<br />  }catch(Exception ef){};<br />  try {<br />   http = (HttpURLConnection) url.openConnection();<br />   http.connect();<br />   urlstream = http.getInputStream();<br />  }catch(Exception ef){};<br />  java.io.BufferedReader l_reader = new java.io.<br />  BufferedReader(new java.io.InputStreamReader(urlstream));<br />  try {<br />   while ((currentLine = l_reader.readLine()) != null) {<br />    totalstring += currentLine;<br />   }<br />  } catch (IOException ex3) {}<br />  ....<br />  //本次搜烦的结果已l放到totalstring中了Q是一些HTML代码Q需要下一步进行分析了?br />}<br />  再以googleZQ稍微有些不同,googleҎ览器q行了一些检,~码也不同,URL为http: //www.google.com/search?q=软g发布+版本+inurl:publish.asp&hl=zh-CN&lr= &newwindow=1&start=0&sa=N&ie=UTF-8,其中~码要用ie=UTF-8,start表示从第几条记录昄Q需要注意的是googleҎ览器q要查,如果览器不W合它的要求Q将q回错误代码Q所以在模拟览器提交中Q我们要多加一行代码,修改关键部分要将http属性中的User-Agent讄为常用的览器,比如Mozilla/4.0,代码如下Q?/p> <p>try {<br /> http = (HttpURLConnection) url.openConnection();<br /> http.setRequestProperty("User-Agent", "Mozilla/4.0");<br /> http.connect();<br /> urlstream = http.getInputStream();<br />}catch(Exception ef){};</p> <p>  W二步,对取回的HTML~码q行分析Q取出其中的有用|址信息Qƈ写入文g或者数据库Q由于这些搜索引擎都有网快照和怼|页{网址信息h在HTML中,我们要将q些|址信息剔除掉,剔除的关键就是找出其中的规律Q百度搜索引擎中的网快照和其它没有用的的地址都含有baiduq个关键字,而google中含有的无用|址信息含有关键?google和cache,我们根据这些关键字剔除无用|址信息。在Java中要对字W串q行分析必然要用?java.util.StringTokenizeq个c,用来字W串以特定的分隔W分开Qjava.util.regex.Pattern?java.util.regex.Matcher用来匚w字符Ԍ关键代码如下Q?/p> <p>class CompareStr<br />{<br /> public boolean comparestring(String oristring,String tostring)<br /> {<br />  Pattern p=null; //正则表达?br />  Matcher m=null; //操作的字W串<br />  boolean b;<br />  p = Pattern.compile(oristring,Pattern.CASE_INSENSITIVE);<br />  m = p.matcher(tostring);<br />  b = m.find();<br />  return b;<br /> }<br />}</p> <p>class AnalyUrl<br />{<br /> ......<br /> StringTokenizer token = new StringTokenizer(totalstring," <> \"");<br /> String firstword;<br /> CompareStrcompstr = new CompareStr();<br /> String dsturl = null;<br /> while (token.hasMoreTokens())<br /> {<br />  firstword = token.nextToken();<br />  if (!compstr.comparestring("google.com", firstword) && !compstr.comparestring("cache",firstword))<br />  {<br />   if (firstword.length() > 7)<br />   {<br />    dsturl = firstword.substring(6,firstword.length() - 1);<br />    WriteUrl(dsturl); //成功取到URLQ记录到文g?br />   }<br />  }<br /> }<br />}<br />  通过以上E序Q我们就可以攉到自p的网址信息了,q可以再写另外一个应用程序,Ҏ集到的网址信息q一步分析,取出自己需要的信息Q这里就不再累赘Q道理都是一L。最后需说明一点,google搜烦引擎搜烦所能返回的l果不能过1000条,q了1000条,q接提C“对不vQ?Google 为所有查询的l果数都不会过 1000 个。”,癑ֺ搜烦引擎q回的结果不能超q?00多条Q所以我们要搜烦时尽可能多加关键字,结果范围羃?/p> </td> </tr> </tbody> </table> </td> </tr> <tr> <td width="10" height="11"> <img height="11" src="http://www.javafan.net/article/images/u_16.gif" width="10" /> </td> <td style="BORDER-BOTTOM: rgb(232,232,232) 1px solid" width="695" bgcolor="#f9f9f9" height="11"> <img height="1" src="http://www.javafan.net/article/20051223151611967.html" width="1" /> </td> </tr> <div> </div> <div> </div> <div> </div> <div> </div> <div> <div id="wmqeeuq" class="MSN_EDITCONTAINER"> <div id="wmqeeuq" class="MSN_EDITBOX" contenteditable="true" style="OVERFLOW: auto; WIDTH: 422px; HEIGHT: 44px"> <div>come from </div> <div> <a > <font color="#095801">http://www.javafan.net/article/20051223151611967.html</font> </a> </div> <div> <font color="#095801"> </font> </div> <div> <font color="#095801"> </font> </div> </div> </div> </div> </tbody> </table> <img src ="http://www.aygfsteel.com/ibmsoft/aggbug/52834.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/ibmsoft/" target="_blank">ibmsoft</a> 2006-06-14 19:50 <a href="http://www.aygfsteel.com/ibmsoft/archive/2006/06/14/52834.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss> <footer> <div class="friendship-link"> <a href="http://www.aygfsteel.com/" title="狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频">狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频</a> </div> </footer> վ֩ģ壺 <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">̷</a>| <a href="http://" target="_blank">찲</a>| <a href="http://" target="_blank">ɽ</a>| <a href="http://" target="_blank">̨</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">˹</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">᯹</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ٷ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">¦</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ɽ</a>| <a href="http://" target="_blank">Ž</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ˮ</a>| <a href="http://" target="_blank">û</a>| <a href="http://" target="_blank">˶</a>| <a href="http://" target="_blank">Թ</a>| <a href="http://" target="_blank">лͨ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">½</a>| <a href="http://" target="_blank">Ӣɳ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ͨ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> </body>