本文将指导您如何在您的系统上安装 Hadoop。Hadoop 是一个开源的分布式数据处理框架,用于大规模数据集的存储和计算。

系统要求

在安装 Hadoop 之前,请确保您的系统满足以下要求:

  • 操作系统:Linux、macOS 或 Windows
  • Java:Hadoop 需要 Java 8 或更高版本
  • 网络环境:稳定的网络连接

安装步骤

  1. 下载 Hadoop

    首先,您需要从 Hadoop 官方网站下载 Hadoop 安装包。

    wget http://archive.apache.org/dist/hadoop/common/hadoop-<版本号>/hadoop-<版本号>-bin.tar.gz
    
  2. 解压安装包

    将下载的安装包解压到您选择的目录。

    tar -xvzf hadoop-<版本号>-bin.tar.gz -C /opt/hadoop
    
  3. 设置环境变量

    编辑您的 shell 配置文件(如 .bashrc.bash_profile),添加以下行:

    export HADOOP_HOME=/opt/hadoop/hadoop-<版本号>
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    

    然后,重新加载配置文件:

    source ~/.bashrc
    
  4. 格式化 HDFS

    在安装 Hadoop 后,您需要格式化 HDFS。

    hdfs namenode -format
    
  5. 启动 Hadoop 服务

    启动 Hadoop 需要启动以下服务:

    sbin/start-dfs.sh
    sbin/start-yarn.sh
    

    您可以使用 jps 命令来检查服务是否正在运行。

  6. 测试 Hadoop 安装

    您可以使用以下命令来测试 Hadoop 安装:

    hdfs dfs -copyFromLocal /opt/hadoop/hadoop-<版本号>/README.txt /tmp/README.txt
    

    如果一切正常,您应该在 /tmp/README.txt 文件中找到 README.txt 文件。

扩展阅读

如果您需要进一步了解 Hadoop,可以参考以下资源:

希望这个指南能帮助您顺利安装 Hadoop!

Hadoop Installation