posts - 82, comments - 269, trackbacks - 0, articles - 1
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          2009年6月4日

          posted @ 2011-09-08 08:59 itspy 閱讀(344) | 評論 (0)編輯 收藏

          posted @ 2011-09-07 21:02 itspy 閱讀(16328) | 評論 (0)編輯 收藏

               摘要: Hadoop在做Join時, Bloom Filter可以在Mapper階段就幫助過濾掉大部分無用數據, 同時也不需要把大量的List數據復制到每個Mapper節點. 相比下面的幾種方法十分具有優勢.

          1) 在Reduce階段進行Join,這樣運算量比較小.(這個適合被Join的數據比較小的情況下.)

          2) 壓縮字段,對數據預處理,過濾不需要的字段.





            閱讀全文

          posted @ 2011-08-22 21:43 itspy 閱讀(1581) | 評論 (0)編輯 收藏

               摘要: class Student {
          public String email="lilao#163.com";
          //下面這個代碼符合語法嗎?這段代碼有實際用處嗎?
          {System.out.println("Hello, I'm in Student: "+getClass());}

          }
            閱讀全文

          posted @ 2011-08-12 15:09 itspy 閱讀(483) | 評論 (0)編輯 收藏

          posted @ 2011-08-10 18:12 itspy 閱讀(474) | 評論 (0)編輯 收藏

          posted @ 2009-12-15 12:37 itspy 閱讀(480) | 評論 (0)編輯 收藏

          posted @ 2009-08-07 10:30 itspy 閱讀(316) | 評論 (0)編輯 收藏

          posted @ 2009-07-26 16:49 itspy 閱讀(556) | 評論 (0)編輯 收藏

          posted @ 2009-06-04 17:21 itspy 閱讀(2819) | 評論 (2)編輯 收藏

          主站蜘蛛池模板: 广德县| 九江县| 皮山县| 临颍县| 上蔡县| 宣城市| 福海县| 瑞昌市| 神农架林区| 乌拉特前旗| 惠东县| 紫阳县| 海林市| 和林格尔县| 厦门市| 柏乡县| 隆德县| 佛山市| 宜黄县| 巴林右旗| 河北省| 江津市| 攀枝花市| 宁国市| 五华县| 吕梁市| 新化县| 玉田县| 泸水县| 屏东县| 宁津县| 天峻县| 五常市| 淄博市| 信宜市| 海丰县| 酒泉市| 虎林市| 洪洞县| 东辽县| 沽源县|