大数据分布式集群想要稳定运行必须先完成基础配置工作。项目02主要围绕连网模式、主机网络、防火墙、时钟同步、JDK环境、集群网络、SSH免密、用户管理展开是搭建Hadoop集群前最关键的准备环节。掌握这一章就能解决虚拟机上不了网、主机名不通、节点无法通信、权限异常等高频问题。在搭建集群前首先要确保虚拟机能够正常联网常用检查方式是ping公网地址或使用dhclient重新获取IP。VMware提供三种核心连网模式桥接模式让虚拟机与物理机处于同一网段可直接访问外部网络NAT模式通过地址转换实现上网虚拟机与物理机不在同一网段仅主机模式只能与主机通信一般用于生产环境隔离场景。实际部署中还会用到多网卡设置通过ip a、ifconfig等命令查看网卡信息在/etc/sysconfig/network-scripts/目录下修改网卡配置文件重启network服务即可让IP配置生效。主机网络配置以NAT模式为基础先进行网段规划与DHCP设置再按照集群规划统一分配静态IP。配置网络的核心文件是/etc/sysconfig/network-scripts/ifcfg-ens33需要修改ONBOOT为yes、BOOTPROTO为static并配置IPADDR、NETMASK、GATEWAY、DNS等参数。配置完成后通过systemctl restart network重启网络再用ping命令验证连通性。同时要配置hosts文件实现机器名访问确保节点之间可以用主机名正常通信。集群环境必须关闭防火墙否则会导致节点之间端口无法访问、服务通信失败。CentOS 7关闭防火墙使用systemctl stop firewalld.service命令用firewall-cmd --state查看状态学习环境建议永久关闭。时间同步同样重要Hadoop集群要求所有节点时间一致否则会引发任务异常、认证失败等问题。通过安装ntp、ntpdate工具配置ntp服务器并启动ntpd服务可实现集群节点时间自动同步。Hadoop生态由Java开发必须先部署JDK环境。安装方式支持rpm包与压缩包rpm安装默认路径在/usr目录下。安装完成后需要配置JAVA_HOME、PATH、CLASSPATH等环境变量编辑/etc/profile文件配置完成后执行source命令使变量立即生效最后通过java -version验证JDK是否安装成功。当第一台虚拟机配置完成后可通过VMware克隆快速生成其他节点大幅提高部署效率。克隆完成后必须进行唯一性配置包括修改主机名、IP地址、UUID、MAC地址避免冲突导致网络异常。同时可以对系统进行优化关闭不必要服务、配置DNS、提升网络稳定性为后续集群搭建做好。SSH免密登录是集群自动化运维的基础基于SSH加密协议实现。使用ssh-keygen生成RSA密钥对私钥保留在本地公钥通过ssh-copy-id分发到其他节点实现无需密码登录。免密配置需要在所有节点执行完成后用ssh命令测试连通性。生产环境禁止直接使用root用户需要创建普通用户与用户组设置权限、切换用户、规范操作行为降低系统风险。项目02是大数据集群搭建的基石核心内容包括三种网络模式配置、静态IP设置、防火墙关闭、NTP时间同步、JDK环境部署、虚拟机克隆、SSH免密与用户权限管理。所有操作都是为了保证节点互通、时间一致、权限安全、环境统一为后续Hadoop、ZooKeeper、HBase等组件安装铺平道路。