Hadoop MapReduce(1TB)MapReduce(MR)JobTrackerMR

1. JobTracker 

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

2. JobTracker MR JobTracker fail MR 4000

3. TaskTrackerMRCPU TaskTracker OOM

4. TaskTracker Map task slotReduce task slot, Map taskReduce task

5. bug 

6. MR

MepReduce-开启大数据计算之门 随笔 第1张

    

     MR Hadoop0.23.0Hadoop MRMRYARN 

MepReduce-开启大数据计算之门 随笔 第2张

    JobTracker&ResourceManager ApplicationMaster 

ResourceManagerJobTracker(Scheduler)(Applications ManagerASM)

ApplicationMasterTaskTrackerApplicationMasterApplicationMaster

 

NodeManagerYARN 使 (CPU&&&)

MepReduce-开启大数据计算之门 随笔 第3张

   YARNMR

MepReduce-开启大数据计算之门 随笔 第4张

    

    MRMapReduceCombinerMR(key, value)(*Writable)WorldCountMR

MepReduce-开启大数据计算之门 随笔 第5张

    MapMap<k2, v2>

    ReduceMapv3<k4, v4>中<k3, v3><k2, v2>

 

     HadoopMapReduceIO(IO) (Serialization)MRIntWritableTextWritable口,WritableMRkeyvalue。

    MRIOIOMRShuffle 

* MapReduce

* 

* IO

    MRShuffle()partition() sort()merge()

1. MapReduceMapReduce

    MRPartitionerkeyvalueReduceReducekey hashReduceReduceReduce

2. ReduceMapper(100M)(80M)Spill()线key(A-Za-z)WirtableComparable

 3.  MapReduceMRCombiner(Reducer)Combinerkey

    Combiner使WorldCountMapReduceCombiner使Combiner   

    MapShuffleReduceShuffle

MepReduce-开启大数据计算之门 随笔 第6张

1. ReduceMapMap

2. MergeCombinerMerge()MapMapReduce

    ReduceMapJVMheap sizeShuffleReducerShuffle使 

3. MergeReducerShuffleReducerHDFS

    MRShuffleMRMapperReducer

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄