【问题标题】:Can't install hadoop in a dockerfile which has ubuntu as base image无法在以 ubuntu 作为基础映像的 dockerfile 中安装 hadoop
【发布时间】:2020-12-24 14:29:58
【问题描述】:

当我运行以下代码时,我得到这个错误,E: Unable to locate package hadoop

FROM ubuntu:20.04
RUN apt-get update -y \
 && apt-get install -y apt-utils \
 && apt-get install python3.8 -y
RUN apt-get install jupyter -y
RUN apt-get install hadoop -y
RUN rm -rf /var/lib/apt/lists/*
ADD sample.py /
LABEL maintainer=Ammar
CMD [ "python", "./sample.py" ]

【问题讨论】:

  • 即使你安装了 Hadoop 包,这也不会启动 Hadoop 进程,那么你到底想做什么?
  • 我想创建一个包含 python、jupyter、jenkins 和 hadoop 的 docker 镜像。
  • 你不应该在同一个容器中运行 HDFS 数据节点、名称节点和 YARN...这是我的一个示例 repo,将它们分开 github.com/OneCricketeer/docker-stacks/tree/master/hadoop-spark

标签: docker ubuntu hadoop dockerfile docker-image


【解决方案1】:

此链接:https://computingforgeeks.com/install-apache-hadoop-hbase-on-ubuntu-linux/ 包含 Hadoop 安装的完整示例。我认为应该在 Docker 中一步一步地做同样的事情。

apt-get install hadoop 在不添加外部存储库的情况下无法在 ubuntu 中工作。但是如果你知道外部仓库,那么你必须添加softwaree-properties-common包(像这样:https://stackoverflow.com/a/52091668/1852444) 然后通过apt-add-repository 命令添加您的存储库。

【讨论】:

    【解决方案2】:

    一些“foss”软件和不在foss 下的软件没有添加到ubuntu 存储库中,因此无法使用apt 安装它们,因为apt 使用这些存储库安装软件包。

    hadoop 是这些未添加到 ubuntu 存储库的软件包之一。有关存储库的更多信息,您可以查看here

    您可以拉取和使用其他人在dockerhub 中创建和推送的hadoop 容器映像之一,而不是从头开始创建它。

    如果您仍想创建自己的 hadoop 容器映像,可以查看 this example hadoop dockerfile

    【讨论】:

    • Hadoop 是 FOSS / Apache 许可的,所以不清楚你的第一个陈述
    • hadoop 是foss,但即使在foss 之后仍有一些软件不包含在ubuntu
    猜你喜欢
    • 2020-08-20
    • 1970-01-01
    • 2019-08-02
    • 1970-01-01
    • 1970-01-01
    • 2018-09-29
    • 1970-01-01
    • 2015-02-01
    • 1970-01-01
    相关资源
    最近更新 更多