posts - 82, comments - 269, trackbacks - 0, articles - 1
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          2009年8月7日

          posted @ 2011-09-08 08:59 itspy 閱讀(337) | 評論 (0)編輯 收藏

          posted @ 2011-09-07 21:02 itspy 閱讀(16324) | 評論 (0)編輯 收藏

               摘要: Hadoop在做Join時, Bloom Filter可以在Mapper階段就幫助過濾掉大部分無用數(shù)據(jù), 同時也不需要把大量的List數(shù)據(jù)復(fù)制到每個Mapper節(jié)點. 相比下面的幾種方法十分具有優(yōu)勢.

          1) 在Reduce階段進行Join,這樣運算量比較小.(這個適合被Join的數(shù)據(jù)比較小的情況下.)

          2) 壓縮字段,對數(shù)據(jù)預(yù)處理,過濾不需要的字段.





            閱讀全文

          posted @ 2011-08-22 21:43 itspy 閱讀(1576) | 評論 (0)編輯 收藏

               摘要: class Student {
          public String email="lilao#163.com";
          //下面這個代碼符合語法嗎?這段代碼有實際用處嗎?
          {System.out.println("Hello, I'm in Student: "+getClass());}

          }
            閱讀全文

          posted @ 2011-08-12 15:09 itspy 閱讀(477) | 評論 (0)編輯 收藏

          posted @ 2011-08-10 18:12 itspy 閱讀(465) | 評論 (0)編輯 收藏

          posted @ 2009-12-15 12:37 itspy 閱讀(473) | 評論 (0)編輯 收藏

          posted @ 2009-08-07 10:30 itspy 閱讀(311) | 評論 (0)編輯 收藏

          主站蜘蛛池模板: 辉南县| 依安县| 左云县| 栾城县| 同仁县| 克东县| 清新县| 黑山县| 安陆市| 县级市| 郑州市| 伊通| 正镶白旗| 吉木乃县| 贵南县| 乐昌市| 松滋市| 浮山县| 安顺市| 长岭县| 安仁县| 玉田县| 庆元县| 高州市| 滕州市| 金昌市| 曲沃县| 清流县| 柯坪县| 顺义区| 黔东| 肥乡县| 普陀区| 伊春市| 抚州市| 张家口市| 阿拉尔市| 碌曲县| 筠连县| 原阳县| 合作市|