posts - 82, comments - 269, trackbacks - 0, articles - 1
            BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          2011年8月12日

          posted @ 2011-09-08 08:59 itspy 閱讀(342) | 評(píng)論 (0)編輯 收藏

          posted @ 2011-09-07 21:02 itspy 閱讀(16326) | 評(píng)論 (0)編輯 收藏

               摘要: Hadoop在做Join時(shí), Bloom Filter可以在Mapper階段就幫助過(guò)濾掉大部分無(wú)用數(shù)據(jù), 同時(shí)也不需要把大量的List數(shù)據(jù)復(fù)制到每個(gè)Mapper節(jié)點(diǎn). 相比下面的幾種方法十分具有優(yōu)勢(shì).

          1) 在Reduce階段進(jìn)行Join,這樣運(yùn)算量比較小.(這個(gè)適合被Join的數(shù)據(jù)比較小的情況下.)

          2) 壓縮字段,對(duì)數(shù)據(jù)預(yù)處理,過(guò)濾不需要的字段.





            閱讀全文

          posted @ 2011-08-22 21:43 itspy 閱讀(1579) | 評(píng)論 (0)編輯 收藏

               摘要: class Student {
          public String email="lilao#163.com";
          //下面這個(gè)代碼符合語(yǔ)法嗎?這段代碼有實(shí)際用處嗎?
          {System.out.println("Hello, I'm in Student: "+getClass());}

          }
            閱讀全文

          posted @ 2011-08-12 15:09 itspy 閱讀(480) | 評(píng)論 (0)編輯 收藏

          主站蜘蛛池模板: 盖州市| 双辽市| 南宫市| 涞水县| 延津县| 石楼县| 株洲县| 邮箱| 嘉定区| 甘德县| 藁城市| 浑源县| 牡丹江市| 措勤县| 拜城县| 邵东县| 仲巴县| 黔西县| 浪卡子县| 沧源| 公主岭市| 娄烦县| 永济市| 花莲市| 南郑县| 得荣县| 繁昌县| 新疆| 澜沧| 松潘县| 饶阳县| 武隆县| 高清| 普格县| 肥乡县| 桐乡市| 神农架林区| 秦皇岛市| 海丰县| 油尖旺区| 华安县|