datanode首次加入集群,为何namenode要进行格式化操作

(1)问题分析
考官主要考核你的hadoop环境搭建能力,这道题本身是一个误导题,也考察你是否具有自我判断能力。

(2)核心答案讲解
这道题本身是一个误导题目。这样处理是不合理的,因为namenode格式化操作,是对文件系统进行格式化,namenode格式化时清空dfs/name两个目录下的所有文件,之后,会在目录dfs.name.dir下创建文件。
文本不兼容,有可能是namenode与datanode数据里的namespaceID、clusterID不一致,找到两个ID位置,修改为一样即可解决。

(3)问题拓展
NameNode它是hadoop中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问,保存有metadata。
SecondaryNameNode它不是namenode的冗余守护进程,而是提供周期检查点和清理任务,帮助NN合并editslog,减少NN启动时间。
DataNode它负责管理连接到节点的存储(一个集群中可以有多个节点)。每个存储数据的节点运行一个datanode守护进程。

(4)结合项目中使用

点击此处
隐藏目录