前言

此文档是用于大数据集群环境搭建教程【自用】,包括项目

安装前介绍

总计7台设备,3台计算服务层,4台存储服务层,因IP敏感此处IP使用ip1~ip7指代

硬件设备

序号 服务 ip CPU 内存(G) 磁盘(T) 操作系统 应用部署
4 数据仓库计算服务 ip1 32C64线程 64 2 redhat7.6 1、hadoop【DataNode、nodemanager】 2、dolphinscheduler【master、api、works】 3、spark【master】
5 数据仓库计算服务 ip2 32C64线程 64 2 redhat7.6 1、hadoop【DataNode、nodemanager】 2、dolphinscheduler【works】 3、spark【slaver】
6 数据仓库计算服务 ip3 32C64线程 64 2 redhat7.6 1、hadoop【DataNode、nodemanager】 2、dolphinscheduler【works、alert】 3、spark【slaver】
7 数据仓库存储服务 ip4 32C64线程 64 66 redhat7.6 1、hadoop【DFSZKFailover、JournalNode、NameNode、DataNode、NodeManager、ResourceManager】 2、hive【metastore、server2】 3、hbase【HMaster、HRegionServer】
8 数据仓库存储服务 ip5 32C64线程 64 66 redhat7.6 1、hadoop【DFSZKFailover、JournalNode、NameNode、DataNode、NodeManager、ResourceManager】 2、hive【metastore、server2】 3、hbase【HRegionServer】
9 数据仓库存储服务 ip6 32C64线程 64 66 redhat7.6 1、hadoop【DFSZKFailover、JournalNode、NameNode、DataNode、NodeManager、ResourceManager】 2、hive【metastore、server2】 3、hbase【HRegionServer】 4、ProgreSql【主】
10 数据仓库存储服务 ip7 32C64线程 64 66 redhat7.6 1、hadoop【DataNode、nodemanager】 2、hive【metastore、server2】 3、hbase【HRegionServer】 4、ProgreSql【从】

软件版本

组件名称 当前版本 审批版本
ZooKeeper 3.8.4 3.8.0(存在漏洞)
hadoop 3.3.0 3.3.0
Hbase 2.5.6 2.5.6
Spark 3.3.1 3.3.1
Hive 3.1.2 3.1.2
PostgreSQL 16.0 16.0
dolphinscheduler 3.1.4 3.1.4
Scala 2.12.17 2.12.17
nacos 2.0.3 2.0.3
xxl-job 2.3.0 2.3.0