Hive的安装之本地和远程模式
本地和远程模式安装配置方式大致相同,本质上是将Hive默认的元数据存储介质由自带的Derby数据库替换为MySQL数据库,这样无论在任何目录下以任何方式启动Hive,只要连接的是同一台Hive服务,那么所有节点访问的元数据信息是一致的,从而实现元数据的共享。下面就以本地模式为例,讲解安装过程。
本地模式的Hive安装主要包括两个步骤:首先安装MySQL服务,再安装Hive。具体步骤如下:
1.安装MySQL服务
MySQL安装方式有许多种,可以直接解压安装包进行相关配置,也可以选择在线安装,本节选用在线安装MySQL方式。在线安装MySQL的具体指令和说明如下:
// 下载安装MySQL
$ yum install mysql mysql-server mysql-devel
// 启动MySQL服务
$ /etc/init.d/mysqld start
// MySQL连接并登录MySQL服务
$ mysql
上述指令中,首先通过“yum install”命令下载并安装MySQL程序,并且启动MySQL服务,然后就可以使用MySQL命令连接到MySQL客户端。
接下来,进入MySQL客户端后,分别对MySQL数据库密码进行修改(可选),并设置允许远程登录权限,具体指令如下:
// 修改登录MySQL用户名及密码
mysql> USE mysql;
mysql> UPDATE user SET Password=PASSWORD('123456') WHERE user='root';
// 设置允许远程登录
mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY
'123456' WITH GRANT OPTION;
// 强制写入
mysql> FLUSH PRIVILEGES;
2.Hive的配置
(1)修改hive-env.sh配置文件,配置Hadoop环境变量
进入Hive安装包下的conf文件夹,将hive-env.sh.template文件进行拷贝并重命名为hive-env.sh,具体指令如下:
$ cd /export/servers/apache-hive-1.2.1-bin/conf
$ cp hive-env.sh.template hive-env.sh
然后修改hive-env.sh配置文件,添加Hadoop环境变量,具体内容如下:
export HADOOP_HOME=/export/servers/hadoop-2.7.4
上述操作是设置Hadoop环境变量,作用是无论系统是否配置Hadoop环境变量,在Hive执行时,一定能够通过hive-env.sh配置文件去加载Hadoop环境变量,由于在部署Hadoop集群时已经配置了全局Hadoop环境变量,因此可以不设置该参数。
(2)添加hive-site.xml配置文件,配置MySQL相关信息
由于Hive安装包conf目录下,没有提供hive-site.xml文件,这里需要创建并编辑一个hive-site.xml配置文件,具体内容如下所示:
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
<description>Mysql连接协议</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>JDBC连接驱动</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>用户名</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
<description>密码</description>
</property>
</configuration>
完成配置后,Hive就会把默认使用Derby数据库方式所覆盖。这里需要注意的是,由于使用了MySQL数据库,那么就需要上传MySQL连接驱动的Jar包到Hive安装包的lib文件夹下,本教材使用mysql-connector-java-5.1.32.jar,使用rz命令上传即可。至此就完成了本地模式的安装。
如果使用远程模式的安装方式,只需要将hive-site.xml配置文件中的localhost修改为具有MySQL服务的节点IP即可,这样无论用户通过什么路径下启动Hive客户端,都可以访问相同的元数据信息。