泰仔在線(xiàn)

          java學(xué)習(xí),心情日記,繽紛時(shí)刻
          posts - 100, comments - 34, trackbacks - 0, articles - 0

          2009年9月5日

               摘要: Linuxのポート狀況を確認(rèn)する(netstat)
          Linuxのポート狀況を確認(rèn)するには、netstatコマンドを使用します。
          netstatコマンドが表示する情報(bào)には、ポート情報(bào)以外に、ルーティング
          テーブル、IPマスカレードなど様々な情報(bào)を得ることができます。
          netstatは表示できる情報(bào)が多いため、オプションを使い分けることで
          必要な情報(bào)のみを表示する使い方が宜しいと思います。  閱讀全文

          posted @ 2016-01-15 12:10 泰仔在線(xiàn) 閱讀(280) | 評(píng)論 (0)編輯 收藏

               摘要: JdkにSSLルート証明書(shū)をインストールする(例として、GeoTrustのRapidSSLSHA2(SHA256))  閱讀全文

          posted @ 2015-10-21 09:46 泰仔在線(xiàn) 閱讀(277) | 評(píng)論 (0)編輯 收藏

               摘要: 常用Maven plugin使用  閱讀全文

          posted @ 2015-10-21 09:29 泰仔在線(xiàn) 閱讀(237) | 評(píng)論 (0)編輯 收藏

               摘要: 那如何查看進(jìn)程的全路徑呢?
          其實(shí)每個(gè)進(jìn)程啟動(dòng)之后在 /proc下面有一個(gè)于pid對(duì)應(yīng)的路徑

          # ll /proc/31723
          總用量 0
          dr-xr-xr-x 2 root root 0 3月 19 18:13 attr
          -r-------- 1 root root 0 3月 19 18:13 auxv
          -r--r--r-- 1 root root 0 3月 19 18:04 cmdline
          -rw-r--r-- 1 root root 0 3月 19 18:13 coredump_filter
          -r--r--r-- 1 root root 0 3月 19 18:13 cpuset
          lrwxrwxrwx 1 root root 0 3月 19 18:13 cwd -> /
          -r-------- 1 root root 0 3月 19 18:13 environ
          lrwxrwxrwx 1 root root 0 3月 19 18:13 exe -> /usr/sbin/htt  閱讀全文

          posted @ 2014-03-19 17:21 泰仔在線(xiàn) 閱讀(4097) | 評(píng)論 (0)編輯 收藏

               摘要: 1、 什么是SSL?
          SSL 是一個(gè)安全協(xié)議,最初是由美國(guó)網(wǎng)景 Netscape Communication 公司設(shè)計(jì)開(kāi)發(fā)的,全稱(chēng)為安全套接層協(xié)議 (Secure Sockets Layer) 。它采用公開(kāi)密鑰技術(shù)為傳輸通信提供如下幫助:
          1. 信息傳輸?shù)谋C苄裕?
          2. 數(shù)據(jù)交換的完整性;
          3. 信息的不可否認(rèn)性;
          4. 交易者身份確定性。
          換句話(huà)說(shuō),服務(wù)器部署SSL證書(shū)后,其核心能就是確保服務(wù)器與瀏覽器之間的數(shù)據(jù)傳輸是加密傳輸?shù)模跀?shù)據(jù)傳輸過(guò)程中不被篡改或被解密。瀏覽器上,用戶(hù)可通過(guò)“金色鎖型”標(biāo)記,得知是否已處于SSL安全保護(hù),如果更先進(jìn)的VeriSign EV SSL證書(shū),那么除了“鎖型”標(biāo)記外,瀏覽器的地址欄還會(huì)變成綠色。
            閱讀全文

          posted @ 2013-08-21 13:47 泰仔在線(xiàn) 閱讀(291) | 評(píng)論 (0)編輯 收藏

               摘要: linux如何查看端口被誰(shuí)占用
          使用 netstat 進(jìn)行查看!
          >netstat -noap | grep 80 | grep tcp
          使用 lsof 進(jìn)行查看!
          >/usr/sbin/lsof -i tcp:8080
          >/usr/sbin/lsof -i :22
          >/usr/sbin/lsof -i | grep http
            閱讀全文

          posted @ 2013-05-13 11:44 泰仔在線(xiàn) 閱讀(15828) | 評(píng)論 (0)編輯 收藏

               摘要: 想使用的端口又被誰(shuí)給占用了,想確認(rèn)一下被誰(shuí)占用了嗎。
          首先打開(kāi)命令行窗口CMD,使用 netstat 進(jìn)行查看!
          >netstat -aon | findstr 端口號(hào)
          >tasklist | findstr PID
          App Name PID Session ID Memory
          -----------------------------------------------------------------------  閱讀全文

          posted @ 2013-05-13 11:07 泰仔在線(xiàn) 閱讀(352) | 評(píng)論 (0)編輯 收藏

               摘要: Q:IBM has its own JVM called J9. Linux versions can be downloaded from DeveloperWorks, but not the Windows versions (except for one requiring IBM hardware). This is most likely a licensing issue. We develop against IBM non-x86 hardware with J9 so it is interesting to use the same JVM for development too.
          What is the official way of getting IBM Java 7 for Windows? (and how expensive is it?)   閱讀全文

          posted @ 2013-04-08 11:41 泰仔在線(xiàn) 閱讀(279) | 評(píng)論 (0)編輯 收藏

               摘要: ALTER SYSTEM SET
          UTL_FILE_DIR='C:\oracle\oradata','C:\oracle\oradata\log'
          SCOPE = SPFILE ;"

          select name,value,description from V$PARAMETER where name like 'u%';  閱讀全文

          posted @ 2010-11-04 14:53 泰仔在線(xiàn) 閱讀(271) | 評(píng)論 (0)編輯 收藏

               摘要: mount -t cifs -o username=root,password=root //192.168.0.194/share /mnt/share_194

          mount -t nfs 192.168.0.196:/home/share /mnt/share_196  閱讀全文

          posted @ 2010-10-22 10:49 泰仔在線(xiàn) 閱讀(306) | 評(píng)論 (0)編輯 收藏

               摘要: Oracle 實(shí)在太強(qiáng)了,本篇文章詳細(xì)介紹了Oracle的遞歸查詢(xún)語(yǔ)法,利用此語(yǔ)法,可以方便地實(shí)現(xiàn)遞歸的雙向查詢(xún):

          -- Tirle : Recursion query for TREE with "connect by/start with"
          -- Author : Rake Gao
          -- Create Date : 2005-08-22
          -- Version : 2.0
          -- Last Modify : 2005-08-22

          目 錄
          一、測(cè)試準(zhǔn)備
          二、實(shí)現(xiàn)各種查詢(xún)要求
          三、要點(diǎn)總結(jié)  閱讀全文

          posted @ 2010-10-13 14:41 泰仔在線(xiàn) 閱讀(348) | 評(píng)論 (0)編輯 收藏

               摘要: 軟件版本Beta,RC,Demo,Build等是什么意思呢?  閱讀全文

          posted @ 2010-09-24 14:54 泰仔在線(xiàn) 閱讀(325) | 評(píng)論 (0)編輯 收藏

               摘要: 一、下載
          1、PowerDesigner 12.5官方下載地址
           http://download.sybase.com/eval/PowerDesigner/powerdesigner125_eval.exe
           大小125 MB (132,006,349 字節(jié))

          二、破解
          環(huán)境:Window 2003 Server Enterprise+sp1+PowerDesigner12.5_eval.exe(12.5.0.2169)
          1、制作license.lic文件
          拷貝以下內(nèi)容,并保存為license.lic文件(注意擴(kuò)展名是lic)
          FEATURE PD_SHELL SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=1
          FEATURE PD_DEV SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=2  閱讀全文

          posted @ 2010-05-07 12:49 泰仔在線(xiàn) 閱讀(2518) | 評(píng)論 (16)編輯 收藏

               摘要: nutch網(wǎng)上有不少有它的源碼解析,但是采集這塊還是不太讓人容易理解.今天終于知道怎么,弄的.現(xiàn)在把crawl-urlfilter.txt文件貼出來(lái),讓大家一塊交流,也給自己備忘錄一個(gè)。  閱讀全文

          posted @ 2010-04-30 10:12 泰仔在線(xiàn) 閱讀(3389) | 評(píng)論 (0)編輯 收藏

               摘要: 解決搜索動(dòng)態(tài)內(nèi)容的問(wèn)題:
          需要注意在conf下面的2個(gè)文件:regex-urlfilter.txt,crawl-urlfilter.txt
          # skip URLs containing certain characters as probable queries, etc.
          -[?*!@=] (-改+)
          這段意思是跳過(guò)在連接中存在? * ! @ = 的頁(yè)面,因?yàn)槟J(rèn)是跳過(guò)所以,在動(dòng)態(tài)頁(yè)中存在?一般按照默認(rèn)的是不能抓取到的。可以在上面2個(gè)文件中都修改成:
          # skip URLs containing certain characters as probable queries, etc.
          # -[?*!@=]
          另外增加允許的一行
          # accept URLs containing certain characters as probable queries, etc.
          +[?=&]
          意思是抓取時(shí)候允許抓取連接中帶 ? = & 這三個(gè)符號(hào)的連接
          注意:兩個(gè)文件都需要修改,因?yàn)镹UTCH加載規(guī)則的順序是cr  閱讀全文

          posted @ 2010-04-24 19:06 泰仔在線(xiàn) 閱讀(2209) | 評(píng)論 (1)編輯 收藏

               摘要: 今天主要研究了Nutch中的html頁(yè)面的解析問(wèn)題,因?yàn)槲业娜蝿?wù)是從頁(yè)面中提取特定的文本,因此首先要找到Nutch如何將html中的文本提取出來(lái)。Nutch提供了兩種html解析器,nekohtml和tagsoup,我采用了neko的解析器,在看了代碼后,發(fā)現(xiàn)其提取文本的方法在org.apache.nutch.parse.html中的DOMContentUtils文件中,主要的函數(shù)是getTextHelper。  閱讀全文

          posted @ 2010-04-23 17:38 泰仔在線(xiàn) 閱讀(3078) | 評(píng)論 (1)編輯 收藏

               摘要: 今天主要解決了Nutch中的一些小的問(wèn)題,下面分別簡(jiǎn)述一下。

          1.網(wǎng)頁(yè)快照亂碼問(wèn)題

          Nutch的網(wǎng)頁(yè)快照是亂碼,解決辦法是修改tomcat/webapps/nutch目錄下的cached.jsp文件,修改其中的第63行。

          原來(lái)的代碼是:content = new String(bean.getContent(details);

          修改后的代碼是:content = new String(bean.getContent(details),"gb2312");
            閱讀全文

          posted @ 2010-04-23 17:36 泰仔在線(xiàn) 閱讀(436) | 評(píng)論 (0)編輯 收藏

               摘要: 當(dāng)某個(gè)插件需要被加載時(shí), Nutch 會(huì)加載所有插件的相關(guān)接口到緩存,此后每個(gè)插件需要實(shí)例的時(shí)候,根據(jù)相關(guān)接口和相關(guān)接口實(shí)現(xiàn)實(shí)例在緩存內(nèi)的記錄,使用反射實(shí)現(xiàn)一個(gè)實(shí)例并返回,下面以 QueryFilter 的所有插件被加載例子進(jìn)行說(shuō)明。  閱讀全文

          posted @ 2010-04-23 11:30 泰仔在線(xiàn) 閱讀(487) | 評(píng)論 (0)編輯 收藏

               摘要: 主要類(lèi)分析:
          一、 org.apache.nutch.crawl.Injector:
          1,注入url.txt
          2,url標(biāo)準(zhǔn)化
          3,攔截url,進(jìn)行正則校驗(yàn)(regex-urlfilter.txt)
          4,對(duì)符URL標(biāo)準(zhǔn)的url進(jìn)行map對(duì)構(gòu)造,在構(gòu)造過(guò)程中給CrawlDatum初始化得分,分?jǐn)?shù)可影響url host的搜索排序,和采集優(yōu)先級(jí)!
          5,reduce只做一件事,判斷url是不是在crawldb中已經(jīng)存在,如果存在則直接讀取原來(lái)CrawlDatum,如果是新host,則把相應(yīng)狀態(tài)存儲(chǔ)到里邊(STATUS_DB_UNFETCHED(狀態(tài)意思為沒(méi)有采集過(guò)))

          二、org.apache.nutch.crawl.Generator:   閱讀全文

          posted @ 2010-04-23 11:05 泰仔在線(xiàn) 閱讀(1056) | 評(píng)論 (0)編輯 收藏

               摘要: 讀者是沒(méi)有耐心的,我也沒(méi)有,所以先說(shuō)結(jié)論:你可以不用編程序,只要鼠標(biāo)點(diǎn)幾下拖動(dòng)些圖標(biāo),改改參數(shù),就能完成過(guò)億數(shù)據(jù)的分布處理程序。

          當(dāng)然,這么理想的目標(biāo)現(xiàn)在還沒(méi)有達(dá)到,但路已經(jīng)明明白白的展現(xiàn)在面前了,至少我們已經(jīng)走了接近一半了。  閱讀全文

          posted @ 2010-04-21 11:41 泰仔在線(xiàn) 閱讀(796) | 評(píng)論 (0)編輯 收藏

               摘要: 1. 介紹
          MapReduce是google發(fā)明的一種編程模型。在這種編程模型下,用戶(hù)通過(guò)定義一個(gè)map函數(shù)和一個(gè)reduce函數(shù)來(lái)解決問(wèn)題。map函數(shù)對(duì)用戶(hù)輸入的鍵/值對(duì)(key/value pair)進(jìn)行處理(處理時(shí)可能只有值這一項(xiàng)有用),生成一系列新的鍵/值對(duì)作為中間結(jié)果;系統(tǒng)(MapReduce的實(shí)現(xiàn))對(duì)map函數(shù)生成的鍵/值對(duì)進(jìn)行處理,將同屬于一個(gè)鍵(key)的值(value)組合在一起,生成鍵/值列表((key/list of values) pair)對(duì);reduce函數(shù)將鍵/值列表對(duì)作為輸入,對(duì)同屬于一個(gè)鍵的值列表進(jìn)行處理,生成最終處理結(jié)果輸出。

          如果一個(gè)問(wèn)題可以通過(guò)MapReduce編程模型來(lái)表達(dá)和解決,就可以通過(guò)MapReduce系統(tǒng)自動(dòng)獲得并行執(zhí)行能力。程序員不需要有并行程序設(shè)計(jì)的經(jīng)驗(yàn),只需要定義map和reduce函數(shù)。  閱讀全文

          posted @ 2010-04-21 11:29 泰仔在線(xiàn) 閱讀(1579) | 評(píng)論 (0)編輯 收藏

               摘要: eclipse 起動(dòng)后報(bào)JVM terminated. Exit code=127的解決辦法  閱讀全文

          posted @ 2009-12-28 16:11 泰仔在線(xiàn) 閱讀(1634) | 評(píng)論 (0)編輯 收藏

               摘要: jnlp是什么?是java提供的一種讓你可以通過(guò)瀏覽器直接執(zhí)行java應(yīng)用程序的途徑,它使你可以直接通過(guò)一個(gè)網(wǎng)頁(yè)上的url連接打開(kāi)一個(gè)java應(yīng) 用程序.好處就不用說(shuō)了,如果你的java應(yīng)用程序以jnlp 的方式發(fā)布,如果版本升級(jí)后,不需要再向所有用戶(hù)發(fā)布版本,只需要更新服務(wù)器的版本,這就相當(dāng)于讓java應(yīng)用程序有了web應(yīng)用的優(yōu)點(diǎn)了  閱讀全文

          posted @ 2009-12-25 16:43 泰仔在線(xiàn) 閱讀(267) | 評(píng)論 (0)編輯 收藏

               摘要: 1.創(chuàng)建工作簿 (WORKBOOK)
          HSSFWorkbook wb = new HSSFWorkbook();
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();
          2.創(chuàng)建工作表(SHEET)
          HSSFWorkbook wb = new HSSFWorkbook();
          HSSFSheet sheet1 = wb.createSheet("new sheet");
          HSSFSheet sheet2 = wb.createSheet("second sheet");
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();  閱讀全文

          posted @ 2009-09-23 19:48 泰仔在線(xiàn) 閱讀(357) | 評(píng)論 (0)編輯 收藏

               摘要: Nutch的內(nèi)部網(wǎng)增量縮影是可以通過(guò)recrawl腳本(nutch的wiki上有發(fā)布)進(jìn)行增量更新,但是對(duì)于對(duì)于全網(wǎng)爬取的URL如何做到增量更新,目前來(lái)說(shuō)還沒(méi)有相關(guān)的方法,尤其是對(duì)于上TB級(jí)別數(shù)據(jù)的索引更新和合并,直接把Nutch似乎還有相當(dāng)多的問(wèn)題需要解決(比如分布式大索引分割、合并等等,在Nutch的mailing list上大家討論了非常多,但還是沒(méi)有一個(gè)合理的解決方案),因此,作者期望通過(guò)解讀源碼的方式來(lái)對(duì)Nutch的索引構(gòu)建機(jī)制和源碼做一個(gè)較為初淺的解讀,以期通過(guò)修改解決Nutch的索引面臨的問(wèn)題,期望能得到廣大網(wǎng)友的意見(jiàn)。
          考慮到筆者的需求是Nutch對(duì)于海量的數(shù)據(jù)的索引,因此基于集群的方式對(duì)Nutch的源碼進(jìn)行解讀。
          本文是針對(duì)Nutch1.0而寫(xiě),Nutch1.0相比0.9更多的功能采用了Map/reduce算法結(jié)構(gòu),若不是先前對(duì)MapReduce有一番了解,看起來(lái)將是非常費(fèi)解。
          首先:補(bǔ)充一點(diǎn)最基礎(chǔ)的知識(shí),就是Nutch的文件目錄所包含的內(nèi)容:   閱讀全文

          posted @ 2009-09-05 17:00 泰仔在線(xiàn) 閱讀(1532) | 評(píng)論 (1)編輯 收藏

               摘要: 關(guān)鍵字: nutch 命令
          Nutch采用了一種命令的方式進(jìn)行工作,其命令可以是對(duì)局域網(wǎng)方式的單一命令也可以是對(duì)整個(gè)Web進(jìn)行爬取的分步命令。主要的命令如下:

          1. Crawl
          Crawl是“org.apache.nutch.crawl.Crawl”的別稱(chēng),它是一個(gè)完整的爬取和索引過(guò)程命令。
          2. Readdb
          Readdb命令是“org.apache.nutch.crawl.CrawlDbReader”的別稱(chēng),返回或者導(dǎo)出Crawl數(shù)據(jù)庫(kù)(crawldb)中的信息。
          3. readlinkdb
          它是"org.apache.nutch.crawl.LinkDbReader"的別稱(chēng),導(dǎo)出鏈接庫(kù)中信息或者返回其中一個(gè)URL信息。
          4. inject
          它是"org.apache.nutch.crawl.Injector"的別稱(chēng),注入新URL到crawldb中。
          5. generate
          它是“org.apache.nutch.crawl.Generator”,從Cra  閱讀全文

          posted @ 2009-09-05 16:55 泰仔在線(xiàn) 閱讀(8097) | 評(píng)論 (0)編輯 收藏

          主站蜘蛛池模板: 南城县| 盘锦市| 尼木县| 长治市| 西和县| 昭平县| 革吉县| 白山市| 将乐县| 从化市| 广东省| 阳新县| 彭阳县| 镇坪县| 青神县| 沁阳市| 克山县| 定州市| 景谷| 敦煌市| 梁平县| 长葛市| 阳曲县| 桃园县| 汉川市| 建湖县| 彰化县| 从江县| 正蓝旗| 城步| 公安县| 西宁市| 兴山县| 清涧县| 茌平县| 正阳县| 施甸县| 子长县| 长白| 宁城县| 鸡东县|