泰仔在線

          java學習,心情日記,繽紛時刻
          posts - 100, comments - 34, trackbacks - 0, articles - 0

          導航

          <2025年7月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          留言簿(3)

          隨筆分類

          收藏夾

          Database相關

          Enet 沖浪

          Java 技術

          Linux相關

          搜索

          •  

          最新評論

          閱讀排行榜

               摘要: 1. 介紹
          MapReduce是google發(fā)明的一種編程模型。在這種編程模型下,用戶通過定義一個map函數(shù)和一個reduce函數(shù)來解決問題。map函數(shù)對用戶輸入的鍵/值對(key/value pair)進行處理(處理時可能只有值這一項有用),生成一系列新的鍵/值對作為中間結果;系統(tǒng)(MapReduce的實現(xiàn))對map函數(shù)生成的鍵/值對進行處理,將同屬于一個鍵(key)的值(value)組合在一起,生成鍵/值列表((key/list of values) pair)對;reduce函數(shù)將鍵/值列表對作為輸入,對同屬于一個鍵的值列表進行處理,生成最終處理結果輸出。

          如果一個問題可以通過MapReduce編程模型來表達和解決,就可以通過MapReduce系統(tǒng)自動獲得并行執(zhí)行能力。程序員不需要有并行程序設計的經(jīng)驗,只需要定義map和reduce函數(shù)。  閱讀全文

          posted @ 2010-04-21 11:29 泰仔在線 閱讀(1581) | 評論 (0)編輯 收藏

               摘要: eclipse 起動后報JVM terminated. Exit code=127的解決辦法  閱讀全文

          posted @ 2009-12-28 16:11 泰仔在線 閱讀(1638) | 評論 (0)編輯 收藏

               摘要: jnlp是什么?是java提供的一種讓你可以通過瀏覽器直接執(zhí)行java應用程序的途徑,它使你可以直接通過一個網(wǎng)頁上的url連接打開一個java應 用程序.好處就不用說了,如果你的java應用程序以jnlp 的方式發(fā)布,如果版本升級后,不需要再向所有用戶發(fā)布版本,只需要更新服務器的版本,這就相當于讓java應用程序有了web應用的優(yōu)點了  閱讀全文

          posted @ 2009-12-25 16:43 泰仔在線 閱讀(270) | 評論 (0)編輯 收藏

               摘要: 1.創(chuàng)建工作簿 (WORKBOOK)
          HSSFWorkbook wb = new HSSFWorkbook();
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();
          2.創(chuàng)建工作表(SHEET)
          HSSFWorkbook wb = new HSSFWorkbook();
          HSSFSheet sheet1 = wb.createSheet("new sheet");
          HSSFSheet sheet2 = wb.createSheet("second sheet");
          FileOutputStream fileOut = new FileOutputStream("workbook.xls");
          wb.write(fileOut);
          fileOut.close();  閱讀全文

          posted @ 2009-09-23 19:48 泰仔在線 閱讀(360) | 評論 (0)編輯 收藏

               摘要: Nutch的內(nèi)部網(wǎng)增量縮影是可以通過recrawl腳本(nutch的wiki上有發(fā)布)進行增量更新,但是對于對于全網(wǎng)爬取的URL如何做到增量更新,目前來說還沒有相關的方法,尤其是對于上TB級別數(shù)據(jù)的索引更新和合并,直接把Nutch似乎還有相當多的問題需要解決(比如分布式大索引分割、合并等等,在Nutch的mailing list上大家討論了非常多,但還是沒有一個合理的解決方案),因此,作者期望通過解讀源碼的方式來對Nutch的索引構建機制和源碼做一個較為初淺的解讀,以期通過修改解決Nutch的索引面臨的問題,期望能得到廣大網(wǎng)友的意見。
          考慮到筆者的需求是Nutch對于海量的數(shù)據(jù)的索引,因此基于集群的方式對Nutch的源碼進行解讀。
          本文是針對Nutch1.0而寫,Nutch1.0相比0.9更多的功能采用了Map/reduce算法結構,若不是先前對MapReduce有一番了解,看起來將是非常費解。
          首先:補充一點最基礎的知識,就是Nutch的文件目錄所包含的內(nèi)容:   閱讀全文

          posted @ 2009-09-05 17:00 泰仔在線 閱讀(1535) | 評論 (1)編輯 收藏

               摘要: 關鍵字: nutch 命令
          Nutch采用了一種命令的方式進行工作,其命令可以是對局域網(wǎng)方式的單一命令也可以是對整個Web進行爬取的分步命令。主要的命令如下:

          1. Crawl
          Crawl是“org.apache.nutch.crawl.Crawl”的別稱,它是一個完整的爬取和索引過程命令。
          2. Readdb
          Readdb命令是“org.apache.nutch.crawl.CrawlDbReader”的別稱,返回或者導出Crawl數(shù)據(jù)庫(crawldb)中的信息。
          3. readlinkdb
          它是"org.apache.nutch.crawl.LinkDbReader"的別稱,導出鏈接庫中信息或者返回其中一個URL信息。
          4. inject
          它是"org.apache.nutch.crawl.Injector"的別稱,注入新URL到crawldb中。
          5. generate
          它是“org.apache.nutch.crawl.Generator”,從Cra  閱讀全文

          posted @ 2009-09-05 16:55 泰仔在線 閱讀(8101) | 評論 (0)編輯 收藏

               摘要: 一、 基本書寫規(guī)范  

          1、所有的CSS的盡量采用外部調(diào)用
            
            
             書寫時重定義的最先,偽類其次,自定義最后(其中a:link a:visited a:hover a:actived 要按照順序寫)便于自己和他人閱讀。
            
            為了保證不同瀏覽器上字號保持一致,字號建議用點數(shù)pt和像素px來定義,pt一般使用中文宋體的9pt和11pt,px一般使用中文宋體12pt 和14.7px 這是經(jīng)過優(yōu)化的字號,黑體字或者宋體字加粗時,一般選用11pt和14.7px 的字號比較合適。
            閱讀全文

          posted @ 2009-08-28 15:14 泰仔在線 閱讀(456) | 評論 (0)編輯 收藏

               摘要: 一篇介紹如何編寫和維護你的CSS文件的文檔,非常值得學習。


          Being a CSS expert is more than just memorizing selectors. It’s also working to improve the maintainability and efficiency of your stylesheets, planning for the future and mastering your workflow. In this article Jina Bolton gives 10 CSS tips culled from surveys with 12 top designers.
            閱讀全文

          posted @ 2009-08-28 15:05 泰仔在線 閱讀(272) | 評論 (0)編輯 收藏

               摘要: 序言
          本文檔規(guī)定了在項目實行過程中的CSS開發(fā)規(guī)范。全部開發(fā)人員在編寫CSS代碼時,應遵從該文檔提出的規(guī)范,盡可能的提高可讀性和可維護性。  閱讀全文

          posted @ 2009-08-28 14:58 泰仔在線 閱讀(662) | 評論 (0)編輯 收藏

               摘要: 下載iText的亞洲語言包iTextAsian.jar,加入classpath中。同時也放入到ireport的lib目錄里。
          在ireport的Font選項中,PDF font name選擇STSong-Light,PDF Encoding選擇UniGB-UCS2-H。PDF Embedded選上。
          這樣出來的PDF就能顯示中文。  閱讀全文

          posted @ 2009-08-25 15:00 泰仔在線 閱讀(2476) | 評論 (0)編輯 收藏

          列出全部內(nèi)容
          共9頁: 上一頁 1 2 3 4 5 6 7 8 9 下一頁 
          主站蜘蛛池模板: 黔东| 凤台县| 贵定县| 屏东市| 微博| 泰安市| 鸡西市| 石楼县| 旌德县| 宁蒗| 龙江县| 南安市| 瑞昌市| 广汉市| 贵州省| 梅河口市| 平阳县| 靖安县| 永济市| 汝南县| 平潭县| 邮箱| 岚皋县| 固始县| 东至县| 基隆市| 会理县| 怀远县| 丹寨县| 惠安县| 澄城县| 三门县| 昭平县| 柯坪县| 临高县| 墨竹工卡县| 宝鸡市| 天气| 山西省| 漠河县| 石城县|