首页

51问答网 > hadoop上运行算法，节点越多时间越多

hadoop上运行算法，节点越多时间越多

2025-01-04 11:53:33

推荐回答（2个）

回答1：

这个问题你得先了解 Hadoop一个Job处理时间大概由哪些因素组成：

处理时间 map reduce处理的时间
数据传输的时间==》数据的分发，map中间结果的本地写入，reduce端远程获取数据的时间
数据分片方面，中间结果的大小
数据的本地性，map和reduce在处理本节点的数据时，当然会很快和方面的多了；

综合上面的，可能还有其他的因素，你去考虑下自己的原因吧，

比如很小的数据集，却分了很多的数据片，分配了非常多的map或者reduce，这明显是不合理的，很多的时间都浪费在了数据传输的过程，毕竟这个过程是很慢的，相对于计算来说。。。。

回答2：

你的数据分块是不是不合理？还是数据量比较小？

相关问答

最新问答

壬戌甲辰癸未丙辰女命求高手帮忙看八字，另可以离开出身地发展吗谢谢

麻烦哪位大师给名我的女孩取个姓名：爸爸姓马，妈妈姓唐，性别：女，2010年12月9日6点50分出生。谢谢

穿回清朝当皇帝的txt全集下载地址

如果在考场上语文作文题没有思路写，考前准备的作文又没有合适的可以套用，那该怎么办？

工业设计工程在全国哪些高校有博士点？考试科目和内容具体有哪些？

朋友前几天从香港带回一套suisse programme系列的化妆品，全是是英文，不知道该怎么使用，求翻译…共有...

《爱情和友情的区别》大家可以帮我解释一下这张图吗？谢谢了~

昆山到西宁开车怎么走？开五菱荣光1．2排量车全程多少油钱？

同事辞职了心里好难过

穿越gl小说打包下载