posts - 82, comments - 269, trackbacks - 0, articles - 1
            BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          2011年8月10日

          posted @ 2011-09-08 08:59 itspy 閱讀(338) | 評(píng)論 (0)編輯 收藏

          posted @ 2011-09-07 21:02 itspy 閱讀(16324) | 評(píng)論 (0)編輯 收藏

               摘要: Hadoop在做Join時(shí), Bloom Filter可以在Mapper階段就幫助過(guò)濾掉大部分無(wú)用數(shù)據(jù), 同時(shí)也不需要把大量的List數(shù)據(jù)復(fù)制到每個(gè)Mapper節(jié)點(diǎn). 相比下面的幾種方法十分具有優(yōu)勢(shì).

          1) 在Reduce階段進(jìn)行Join,這樣運(yùn)算量比較小.(這個(gè)適合被Join的數(shù)據(jù)比較小的情況下.)

          2) 壓縮字段,對(duì)數(shù)據(jù)預(yù)處理,過(guò)濾不需要的字段.





            閱讀全文

          posted @ 2011-08-22 21:43 itspy 閱讀(1577) | 評(píng)論 (0)編輯 收藏

               摘要: class Student {
          public String email="lilao#163.com";
          //下面這個(gè)代碼符合語(yǔ)法嗎?這段代碼有實(shí)際用處嗎?
          {System.out.println("Hello, I'm in Student: "+getClass());}

          }
            閱讀全文

          posted @ 2011-08-12 15:09 itspy 閱讀(477) | 評(píng)論 (0)編輯 收藏

          posted @ 2011-08-10 18:12 itspy 閱讀(465) | 評(píng)論 (0)編輯 收藏

          主站蜘蛛池模板: 台前县| 通州区| 焦作市| 九江市| 上林县| 四平市| 洛南县| 宜黄县| 平罗县| 呼和浩特市| 云龙县| 塔城市| 康乐县| 杭锦旗| 怀仁县| 梓潼县| 雅江县| 历史| 晋城| 安阳县| 鄱阳县| 彭阳县| 台山市| 安泽县| 永仁县| 策勒县| 太康县| 彭阳县| 繁峙县| 邓州市| 石景山区| 依安县| 克拉玛依市| 太仓市| 西吉县| 丹棱县| 枝江市| 自贡市| 金溪县| 会昌县| 郎溪县|