posts - 82, comments - 269, trackbacks - 0, articles - 1
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          posted @ 2011-09-08 08:59 itspy 閱讀(344) | 評論 (0)編輯 收藏

          posted @ 2011-09-07 21:02 itspy 閱讀(16328) | 評論 (0)編輯 收藏

               摘要: Hadoop在做Join時, Bloom Filter可以在Mapper階段就幫助過濾掉大部分無用數(shù)據(jù), 同時也不需要把大量的List數(shù)據(jù)復(fù)制到每個Mapper節(jié)點. 相比下面的幾種方法十分具有優(yōu)勢.

          1) 在Reduce階段進行Join,這樣運算量比較小.(這個適合被Join的數(shù)據(jù)比較小的情況下.)

          2) 壓縮字段,對數(shù)據(jù)預(yù)處理,過濾不需要的字段.





            閱讀全文

          posted @ 2011-08-22 21:43 itspy 閱讀(1581) | 評論 (0)編輯 收藏

               摘要: class Student {
          public String email="lilao#163.com";
          //下面這個代碼符合語法嗎?這段代碼有實際用處嗎?
          {System.out.println("Hello, I'm in Student: "+getClass());}

          }
            閱讀全文

          posted @ 2011-08-12 15:09 itspy 閱讀(483) | 評論 (0)編輯 收藏

          posted @ 2011-08-10 18:12 itspy 閱讀(474) | 評論 (0)編輯 收藏

          posted @ 2009-12-15 12:37 itspy 閱讀(480) | 評論 (0)編輯 收藏

          posted @ 2009-08-07 10:30 itspy 閱讀(316) | 評論 (0)編輯 收藏

          posted @ 2009-07-26 16:49 itspy 閱讀(556) | 評論 (0)編輯 收藏

          posted @ 2009-06-04 17:21 itspy 閱讀(2819) | 評論 (2)編輯 收藏

          posted @ 2009-02-07 16:34 itspy 閱讀(421) | 評論 (0)編輯 收藏

          列出全部內(nèi)容
          共9頁: 1 2 3 4 5 6 7 8 9 下一頁 
          主站蜘蛛池模板: 都江堰市| 西林县| 德钦县| 诸城市| 阳西县| 宜黄县| 自治县| 两当县| 西乌珠穆沁旗| 宿州市| 闵行区| 湄潭县| 江达县| 永登县| 电白县| 博乐市| 北流市| 缙云县| 多伦县| 平安县| 涞源县| 尖扎县| 尉氏县| 内丘县| 乐陵市| 河津市| 英山县| 合作市| 石首市| 从江县| 长治市| 鹰潭市| 习水县| 三江| 惠东县| 桂阳县| 鹤壁市| 建水县| 砚山县| 双流县| 越西县|