[Hadoop] 解决Hadoop集群启动时DataNode: Problem connecting to server的问题

问题描述

在配置Hadoop集群并启动时,在slave主机中datanode日志文件中,出现如下错误信息,导致Datanode启动失败:

image

此时,hadoop集群中namenode启动正常(日志文件中没有出现错误)。在master主机上运行:bin/hdfs dfsadmin -report命令,结果如下:

image

初步判断为:slave主机无法连接到master:9000 的相应端口

排除错误

1. 参考资料:hadoop 启动的时候datanode报错 Problem connecting to server,发现在master主机中的master:9000端口已经监听:

image

排除,master:9000端口没有被监听的可能性。

2. 参考资料:Hadoop安装遇到的各种异常及解决办法,发现,master和slave两台主机间ping命令下都可以正常执行,但在slave主机上对master主机进行:telnet master 9000命令,则异常:

在slave主机中:

image

解决问题

1. 运行如下命令,关闭master主机的防火墙:

image

2. 重新在slave主机上对master主机运行:telnet master:9000,成功连接:

image

3. 在master主机中,重新运行如下命令,查看hadoop集群运行情况,发现正常运行:

image

问题解决!!!

参考资料: