ambari-summary
初识ambari
ambari是一个大数据平台的管理工具,包含了hadoop
, yarn
, hive
, hbase
, spark
等大数据的基础架构和工具,简化了数据平台的搭建,之前只是在同事搭建好平台后的一些使用,这次有机会从头开始用ambari
来搭建一个测试的数据平台,过程中也踩到不少坑,简单记录下。
简单过程
- 第一个坑
在刚开始是按照官网的指南,用maven构建,因为GFW的原因,导致反复失败等待,也就是这个guide,因为对maven不熟悉导致有些按图索骥,浪费了很多时间,之后才知道可以直接加repo用yum安装,然而用yum安装马上就出现了第二个坑。 - 第二个坑
因为在线的repo还是因为网络原因很慢很慢,用proxychains勉强把ambari-server本身安装好了,ambari.repo将这个放进/etc/yum.repos.d/
路径下,然后yum update && yum install ambari-server
安装即可,如果有条件就用proxychains走下代理。 - 第三步
安装好ambari-server后先执行ambari-server setup
做一些初始化设置,其中包含了JDK路径的设置,数据库设置,设置好就OK了,然后执行ambari-server start
启动服务,这里有个小插曲,因为ambari-server
涉及到这么多服务,所以管理控制监控之类的模块是必不可少的,这部分可以在ambari-server
的web ui界面安装,也可以命令行提前安装,这部分被称为HDF Management Pack
,运行ambari-server install-mpack \ --mpack=http://public-repo-1.hortonworks.com/HDF/centos7/2.x/updates/2.1.4.0/tars/hdf_ambari_mp/hdf-ambari-mpack-2.1.4.0-5.tar.gz \ --purge \ --verbose
安装,当然这个压缩包可以下载之后指到本地路径安装,然后就可以重启ambari-server