泰仔在線

          java學習,心情日記,繽紛時刻
          posts - 100, comments - 34, trackbacks - 0, articles - 0

               摘要: 1. 介紹
          MapReduce是google發明的一種編程模型。在這種編程模型下,用戶通過定義一個map函數和一個reduce函數來解決問題。map函數對用戶輸入的鍵/值對(key/value pair)進行處理(處理時可能只有值這一項有用),生成一系列新的鍵/值對作為中間結果;系統(MapReduce的實現)對map函數生成的鍵/值對進行處理,將同屬于一個鍵(key)的值(value)組合在一起,生成鍵/值列表((key/list of values) pair)對;reduce函數將鍵/值列表對作為輸入,對同屬于一個鍵的值列表進行處理,生成最終處理結果輸出。

          如果一個問題可以通過MapReduce編程模型來表達和解決,就可以通過MapReduce系統自動獲得并行執行能力。程序員不需要有并行程序設計的經驗,只需要定義map和reduce函數。  閱讀全文

          posted @ 2010-04-21 11:29 泰仔在線 閱讀(1579) | 評論 (0)編輯 收藏

               摘要: eclipse 起動后報JVM terminated. Exit code=127的解決辦法  閱讀全文

          posted @ 2009-12-28 16:11 泰仔在線 閱讀(1634) | 評論 (0)編輯 收藏

               摘要: jnlp是什么?是java提供的一種讓你可以通過瀏覽器直接執行java應用程序的途徑,它使你可以直接通過一個網頁上的url連接打開一個java應 用程序.好處就不用說了,如果你的java應用程序以jnlp 的方式發布,如果版本升級后,不需要再向所有用戶發布版本,只需要更新服務器的版本,這就相當于讓java應用程序有了web應用的優點了  閱讀全文

          posted @ 2009-12-25 16:43 泰仔在線 閱讀(267) | 評論 (0)編輯 收藏

               摘要: 1.創建工作簿 (WORKBOOK)
          HSSFWorkbook wb = new HSSFWorkbook();
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();
          2.創建工作表(SHEET)
          HSSFWorkbook wb = new HSSFWorkbook();
          HSSFSheet sheet1 = wb.createSheet("new sheet");
          HSSFSheet sheet2 = wb.createSheet("second sheet");
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();  閱讀全文

          posted @ 2009-09-23 19:48 泰仔在線 閱讀(357) | 評論 (0)編輯 收藏

               摘要: Nutch的內部網增量縮影是可以通過recrawl腳本(nutch的wiki上有發布)進行增量更新,但是對于對于全網爬取的URL如何做到增量更新,目前來說還沒有相關的方法,尤其是對于上TB級別數據的索引更新和合并,直接把Nutch似乎還有相當多的問題需要解決(比如分布式大索引分割、合并等等,在Nutch的mailing list上大家討論了非常多,但還是沒有一個合理的解決方案),因此,作者期望通過解讀源碼的方式來對Nutch的索引構建機制和源碼做一個較為初淺的解讀,以期通過修改解決Nutch的索引面臨的問題,期望能得到廣大網友的意見。
          考慮到筆者的需求是Nutch對于海量的數據的索引,因此基于集群的方式對Nutch的源碼進行解讀。
          本文是針對Nutch1.0而寫,Nutch1.0相比0.9更多的功能采用了Map/reduce算法結構,若不是先前對MapReduce有一番了解,看起來將是非常費解。
          首先:補充一點最基礎的知識,就是Nutch的文件目錄所包含的內容:   閱讀全文

          posted @ 2009-09-05 17:00 泰仔在線 閱讀(1532) | 評論 (1)編輯 收藏

               摘要: 關鍵字: nutch 命令
          Nutch采用了一種命令的方式進行工作,其命令可以是對局域網方式的單一命令也可以是對整個Web進行爬取的分步命令。主要的命令如下:

          1. Crawl
          Crawl是“org.apache.nutch.crawl.Crawl”的別稱,它是一個完整的爬取和索引過程命令。
          2. Readdb
          Readdb命令是“org.apache.nutch.crawl.CrawlDbReader”的別稱,返回或者導出Crawl數據庫(crawldb)中的信息。
          3. readlinkdb
          它是"org.apache.nutch.crawl.LinkDbReader"的別稱,導出鏈接庫中信息或者返回其中一個URL信息。
          4. inject
          它是"org.apache.nutch.crawl.Injector"的別稱,注入新URL到crawldb中。
          5. generate
          它是“org.apache.nutch.crawl.Generator”,從Cra  閱讀全文

          posted @ 2009-09-05 16:55 泰仔在線 閱讀(8097) | 評論 (0)編輯 收藏

               摘要: 一、 基本書寫規范  

          1、所有的CSS的盡量采用外部調用
            
            
             書寫時重定義的最先,偽類其次,自定義最后(其中a:link a:visited a:hover a:actived 要按照順序寫)便于自己和他人閱讀。
            
            為了保證不同瀏覽器上字號保持一致,字號建議用點數pt和像素px來定義,pt一般使用中文宋體的9pt和11pt,px一般使用中文宋體12pt 和14.7px 這是經過優化的字號,黑體字或者宋體字加粗時,一般選用11pt和14.7px 的字號比較合適。
            閱讀全文

          posted @ 2009-08-28 15:14 泰仔在線 閱讀(453) | 評論 (0)編輯 收藏

               摘要: 一篇介紹如何編寫和維護你的CSS文件的文檔,非常值得學習。


          Being a CSS expert is more than just memorizing selectors. It’s also working to improve the maintainability and efficiency of your stylesheets, planning for the future and mastering your workflow. In this article Jina Bolton gives 10 CSS tips culled from surveys with 12 top designers.
            閱讀全文

          posted @ 2009-08-28 15:05 泰仔在線 閱讀(269) | 評論 (0)編輯 收藏

               摘要: 序言
          本文檔規定了在項目實行過程中的CSS開發規范。全部開發人員在編寫CSS代碼時,應遵從該文檔提出的規范,盡可能的提高可讀性和可維護性。  閱讀全文

          posted @ 2009-08-28 14:58 泰仔在線 閱讀(660) | 評論 (0)編輯 收藏

               摘要: 下載iText的亞洲語言包iTextAsian.jar,加入classpath中。同時也放入到ireport的lib目錄里。
          在ireport的Font選項中,PDF font name選擇STSong-Light,PDF Encoding選擇UniGB-UCS2-H。PDF Embedded選上。
          這樣出來的PDF就能顯示中文。  閱讀全文

          posted @ 2009-08-25 15:00 泰仔在線 閱讀(2472) | 評論 (0)編輯 收藏

          僅列出標題
          共9頁: 上一頁 1 2 3 4 5 6 7 8 9 下一頁 
          主站蜘蛛池模板: 永和县| 车致| 若羌县| 含山县| 广元市| 咸丰县| 康保县| 三门峡市| 商洛市| 泉州市| 龙口市| 七台河市| 呼玛县| 彰武县| 大港区| 专栏| 盐源县| 象州县| 屏南县| 溧水县| 镇安县| 南昌市| 永宁县| 莱西市| 张家口市| 深圳市| 东丽区| 东乡县| 罗甸县| 西乌珠穆沁旗| 三亚市| 垣曲县| 长乐市| 双柏县| 黎城县| 沽源县| 常熟市| 阳城县| 鄂托克旗| 腾冲县| 铜川市|