小明思考
Just a software engineer
posts - 124, comments - 36, trackbacks - 0, articles - 0
BlogJava
::
首頁
::
新隨筆
::
聯系
::
聚合
::
管理
日歷
<
2025年6月
>
日
一
二
三
四
五
六
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
常用鏈接
我的隨筆
我的評論
我的參與
最新評論
留言簿
(5)
給我留言
查看公開留言
查看私人留言
隨筆分類
分布式計算(13)
開發日志(6)
開源項目(2)
數據結構和算法(43)
機器學習
隨筆檔案
2013年5月 (5)
2013年4月 (17)
2012年11月 (1)
2012年3月 (15)
2012年2月 (1)
2012年1月 (3)
2011年10月 (1)
2005年12月 (2)
相冊
1
My blogs
小明思考cppblog
小明思考C++版
搜索
最新評論
1.?re: 回文字符串的切割問題
@selldogs
同意
這算法本身就是O(n^3)的
--2dog
2.?re: 回文字符串的切割問題
第三個的復雜度也是 O(N^3) , 你每次判斷是否是回文 不是也有一個O(N)的循環么
--selldogs
3.?re: 子序列計數
評論內容較長,點擊標題查看
--初學者:阿古
4.?re: 交叉字符串[未登錄]
交叉字符串是用來干嘛的
--wang
5.?re: 交叉字符串
boolean[][] result = new boolean[l1+1][l2+1];
這一句什么作用?
--javanewer
閱讀排行榜
1.?leveldb研究6- Level和Compaction(7902)
2.?Scramble String(6142)
3.?leveldb研究 - 編譯/調試(4844)
4.?leveldb研究5- Snapshot(4498)
5.?leveldb性能分析 - 隨機寫(4175)
評論排行榜
1.?最長連續序列問題(7)
2.?交叉字符串(4)
3.?+1(3)
4.?有點難度的java筆試題(3)
5.?回文字符串的切割問題(3)
開源網絡爬蟲Snaker
Posted on 2012-01-13 15:45
小明
閱讀(3244)
評論(1)
編輯
收藏
所屬分類:
開源項目
最近開發的一個通用網絡爬蟲平臺,主要是想滿足自己想從特定網站抓取大量內容的需求,有如下特點:
1. 支持cookie/session,所以支持登錄論壇和網站
2. 支持圖像識別,可以由人工識別或者機器識別
3. 多線程下載,性能不錯
4. 支持代理
5. 支持HTTPS和證書驗證
6. 支持可插拔腳本,對特別網站使用特別的腳本(javascript編寫)。
7. 有Web界面,操作方便
項目位置:
http://code.google.com/p/ssnaker/
下載:
http://ssnaker.googlecode.com/files/snaker_1.00_b7.zip
最新的版本也實現一個火車票刷票的功能(具體實現都放在engines/train.js)
評論
#
re: 開源網絡爬蟲Snaker
回復
更多評論
2012-12-25 11:18 by
楊先生
你好,我想和您商量關于爬蟲信息問題,謝謝。19093188
新用戶注冊
刷新評論列表
只有注冊用戶
登錄
后才能發表評論。
網站導航:
博客園
IT新聞
Chat2DB
C++博客
博問
管理
相關文章:
記錄Android應用程序行為-peachbox
開源網絡爬蟲Snaker
Powered by:
BlogJava
Copyright © 小明
主站蜘蛛池模板:
兰考县
|
资溪县
|
汶上县
|
彭阳县
|
海南省
|
察隅县
|
长乐市
|
保康县
|
灵寿县
|
集贤县
|
常宁市
|
永胜县
|
山东
|
勃利县
|
大冶市
|
会理县
|
剑川县
|
同仁县
|
施秉县
|
广东省
|
吉安县
|
九台市
|
朝阳县
|
辽中县
|
元氏县
|
五寨县
|
红河县
|
乌拉特中旗
|
承德县
|
新竹市
|
西乡县
|
綦江县
|
巩义市
|
鄂伦春自治旗
|
军事
|
庆安县
|
龙泉市
|
昌宁县
|
清河县
|
东城区
|
长子县
|