hadoop怎么找到数据副本

2024-12-25 20:59:20
推荐回答(1个)
回答1:

dn目录存储的都是数据文件,你要说清理,那就是这些数据已经没用了,
我看到你用的是CDH安装,如果不想要数据了,完全可以重建集群。
如果你要保留数据文件,那可能就要考虑调整副本数了,默认是3,以下的命令会把hadoop文件副本改为1,可以节省三分之二的空间,要注意:只有一个副本的数据是有风险的,损坏就OVER了
hadoop fs -setrep -R 1 /