泰仔在線

          java學(xué)習(xí),心情日記,繽紛時(shí)刻
          posts - 100, comments - 34, trackbacks - 0, articles - 0

               摘要: 1. 介紹
          MapReduce是google發(fā)明的一種編程模型。在這種編程模型下,用戶通過(guò)定義一個(gè)map函數(shù)和一個(gè)reduce函數(shù)來(lái)解決問(wèn)題。map函數(shù)對(duì)用戶輸入的鍵/值對(duì)(key/value pair)進(jìn)行處理(處理時(shí)可能只有值這一項(xiàng)有用),生成一系列新的鍵/值對(duì)作為中間結(jié)果;系統(tǒng)(MapReduce的實(shí)現(xiàn))對(duì)map函數(shù)生成的鍵/值對(duì)進(jìn)行處理,將同屬于一個(gè)鍵(key)的值(value)組合在一起,生成鍵/值列表((key/list of values) pair)對(duì);reduce函數(shù)將鍵/值列表對(duì)作為輸入,對(duì)同屬于一個(gè)鍵的值列表進(jìn)行處理,生成最終處理結(jié)果輸出。

          如果一個(gè)問(wèn)題可以通過(guò)MapReduce編程模型來(lái)表達(dá)和解決,就可以通過(guò)MapReduce系統(tǒng)自動(dòng)獲得并行執(zhí)行能力。程序員不需要有并行程序設(shè)計(jì)的經(jīng)驗(yàn),只需要定義map和reduce函數(shù)。  閱讀全文

          posted @ 2010-04-21 11:29 泰仔在線 閱讀(1583) | 評(píng)論 (0)編輯 收藏

               摘要: eclipse 起動(dòng)后報(bào)JVM terminated. Exit code=127的解決辦法  閱讀全文

          posted @ 2009-12-28 16:11 泰仔在線 閱讀(1647) | 評(píng)論 (0)編輯 收藏

               摘要: jnlp是什么?是java提供的一種讓你可以通過(guò)瀏覽器直接執(zhí)行java應(yīng)用程序的途徑,它使你可以直接通過(guò)一個(gè)網(wǎng)頁(yè)上的url連接打開(kāi)一個(gè)java應(yīng) 用程序.好處就不用說(shuō)了,如果你的java應(yīng)用程序以jnlp 的方式發(fā)布,如果版本升級(jí)后,不需要再向所有用戶發(fā)布版本,只需要更新服務(wù)器的版本,這就相當(dāng)于讓java應(yīng)用程序有了web應(yīng)用的優(yōu)點(diǎn)了  閱讀全文

          posted @ 2009-12-25 16:43 泰仔在線 閱讀(273) | 評(píng)論 (0)編輯 收藏

               摘要: 1.創(chuàng)建工作簿 (WORKBOOK)
          HSSFWorkbook wb = new HSSFWorkbook();
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();
          2.創(chuàng)建工作表(SHEET)
          HSSFWorkbook wb = new HSSFWorkbook();
          HSSFSheet sheet1 = wb.createSheet("new sheet");
          HSSFSheet sheet2 = wb.createSheet("second sheet");
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();  閱讀全文

          posted @ 2009-09-23 19:48 泰仔在線 閱讀(362) | 評(píng)論 (0)編輯 收藏

               摘要: Nutch的內(nèi)部網(wǎng)增量縮影是可以通過(guò)recrawl腳本(nutch的wiki上有發(fā)布)進(jìn)行增量更新,但是對(duì)于對(duì)于全網(wǎng)爬取的URL如何做到增量更新,目前來(lái)說(shuō)還沒(méi)有相關(guān)的方法,尤其是對(duì)于上TB級(jí)別數(shù)據(jù)的索引更新和合并,直接把Nutch似乎還有相當(dāng)多的問(wèn)題需要解決(比如分布式大索引分割、合并等等,在Nutch的mailing list上大家討論了非常多,但還是沒(méi)有一個(gè)合理的解決方案),因此,作者期望通過(guò)解讀源碼的方式來(lái)對(duì)Nutch的索引構(gòu)建機(jī)制和源碼做一個(gè)較為初淺的解讀,以期通過(guò)修改解決Nutch的索引面臨的問(wèn)題,期望能得到廣大網(wǎng)友的意見(jiàn)。
          考慮到筆者的需求是Nutch對(duì)于海量的數(shù)據(jù)的索引,因此基于集群的方式對(duì)Nutch的源碼進(jìn)行解讀。
          本文是針對(duì)Nutch1.0而寫,Nutch1.0相比0.9更多的功能采用了Map/reduce算法結(jié)構(gòu),若不是先前對(duì)MapReduce有一番了解,看起來(lái)將是非常費(fèi)解。
          首先:補(bǔ)充一點(diǎn)最基礎(chǔ)的知識(shí),就是Nutch的文件目錄所包含的內(nèi)容:   閱讀全文

          posted @ 2009-09-05 17:00 泰仔在線 閱讀(1539) | 評(píng)論 (1)編輯 收藏

               摘要: 關(guān)鍵字: nutch 命令
          Nutch采用了一種命令的方式進(jìn)行工作,其命令可以是對(duì)局域網(wǎng)方式的單一命令也可以是對(duì)整個(gè)Web進(jìn)行爬取的分步命令。主要的命令如下:

          1. Crawl
          Crawl是“org.apache.nutch.crawl.Crawl”的別稱,它是一個(gè)完整的爬取和索引過(guò)程命令。
          2. Readdb
          Readdb命令是“org.apache.nutch.crawl.CrawlDbReader”的別稱,返回或者導(dǎo)出Crawl數(shù)據(jù)庫(kù)(crawldb)中的信息。
          3. readlinkdb
          它是"org.apache.nutch.crawl.LinkDbReader"的別稱,導(dǎo)出鏈接庫(kù)中信息或者返回其中一個(gè)URL信息。
          4. inject
          它是"org.apache.nutch.crawl.Injector"的別稱,注入新URL到crawldb中。
          5. generate
          它是“org.apache.nutch.crawl.Generator”,從Cra  閱讀全文

          posted @ 2009-09-05 16:55 泰仔在線 閱讀(8106) | 評(píng)論 (0)編輯 收藏

               摘要: 一、 基本書寫規(guī)范  

          1、所有的CSS的盡量采用外部調(diào)用
            
            
             書寫時(shí)重定義的最先,偽類其次,自定義最后(其中a:link a:visited a:hover a:actived 要按照順序?qū)懀┍阌谧约汉退碎喿x。
            
            為了保證不同瀏覽器上字號(hào)保持一致,字號(hào)建議用點(diǎn)數(shù)pt和像素px來(lái)定義,pt一般使用中文宋體的9pt和11pt,px一般使用中文宋體12pt 和14.7px 這是經(jīng)過(guò)優(yōu)化的字號(hào),黑體字或者宋體字加粗時(shí),一般選用11pt和14.7px 的字號(hào)比較合適。
            閱讀全文

          posted @ 2009-08-28 15:14 泰仔在線 閱讀(459) | 評(píng)論 (0)編輯 收藏

               摘要: 一篇介紹如何編寫和維護(hù)你的CSS文件的文檔,非常值得學(xué)習(xí)。


          Being a CSS expert is more than just memorizing selectors. It’s also working to improve the maintainability and efficiency of your stylesheets, planning for the future and mastering your workflow. In this article Jina Bolton gives 10 CSS tips culled from surveys with 12 top designers.
            閱讀全文

          posted @ 2009-08-28 15:05 泰仔在線 閱讀(278) | 評(píng)論 (0)編輯 收藏

               摘要: 序言
          本文檔規(guī)定了在項(xiàng)目實(shí)行過(guò)程中的CSS開(kāi)發(fā)規(guī)范。全部開(kāi)發(fā)人員在編寫CSS代碼時(shí),應(yīng)遵從該文檔提出的規(guī)范,盡可能的提高可讀性和可維護(hù)性。  閱讀全文

          posted @ 2009-08-28 14:58 泰仔在線 閱讀(664) | 評(píng)論 (0)編輯 收藏

               摘要: 下載iText的亞洲語(yǔ)言包iTextAsian.jar,加入classpath中。同時(shí)也放入到ireport的lib目錄里。
          在ireport的Font選項(xiàng)中,PDF font name選擇STSong-Light,PDF Encoding選擇UniGB-UCS2-H。PDF Embedded選上。
          這樣出來(lái)的PDF就能顯示中文。  閱讀全文

          posted @ 2009-08-25 15:00 泰仔在線 閱讀(2479) | 評(píng)論 (0)編輯 收藏

          僅列出標(biāo)題
          共9頁(yè): 上一頁(yè) 1 2 3 4 5 6 7 8 9 下一頁(yè) 
          主站蜘蛛池模板: 四子王旗| 民权县| 武安市| 汾西县| 锡林浩特市| 泰州市| 松桃| 上高县| 景洪市| 沈丘县| 清新县| 红桥区| 西乌珠穆沁旗| 楚雄市| 邯郸市| 无极县| 龙井市| 莱阳市| 庄河市| 西乌| 梁平县| 固始县| 藁城市| 礼泉县| 宜春市| 邢台县| 光山县| 新绛县| 定边县| 鄱阳县| 保山市| 建平县| 蒙自县| 灵石县| 沂源县| 筠连县| 日土县| 台东市| 稷山县| 阜平县| 桦甸市|