Hadoop三种运行模式的适用场景
Hadoop有三种运行模式:独立(本地)运行模式,伪分布式模式,和完全分布式模式。
(1)独立(本地)运行模式:安装简单,几乎不用做任何配置,但仅限于调试用途。无需任何守护进程,所有的程序都运行在同一个JVM上执行。在独立模式下调试MR程序非常高效方便。所以一般该模式主要是在学习或者开发阶段调试使用 。
(2)伪分布式模式:在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondarynamenode等5个进程,模拟分布式运行的各个节点。Hadoop守护进程运行在本地机器上,模拟一个小规模的集群,换句话说,可以配置一台机器的Hadoop集群,伪分布式是完全分布式的一个特例。
(3)完全分布式模式:正常的Hadoop集群,由多个各司其职的节点构成。Hadoop守护进程运行在一个集群上。
注意:开发环境,使用独立模式;测试环境,可以使用伪分布式模式;线上生产环境,使用完全分布式模式。