【问题标题】:Docker - Share local storage between servicesDocker - 在服务之间共享本地存储
【发布时间】:2019-06-19 20:21:32
【问题描述】:

我正在构建一个多容器应用程序。这是工作目录的整体视图:

MABSED/
|_ docker-compose.yml
|_ ...
|_ streamer/
|  |_ Dockerfile
|  |_ startStreaming.py
|  |_ credentials.py
|_ orchestrator/
   |_ Dockerfile
   |_ requirements.txt
   |_ tasks.py
   |_ my_sched.py
   |_ data/
   |  |_ streaming/
   |  |_ preprocessed/
   |  |_ results/
   |_ detector/
   |_ filter/
   |_ lemmatizer/

我的应用有 4 种不同的服务:一个 ElastisSearch 容器、一个仪表板、一个从 Twitter 捕获推文的 Streamer 和一个执行任务并将结果保存在 ElasticSearch 中的 Orchestrator。

这个问题只涉及两个服务,Streamer 和 Orchestrator。正如我所说,我希望这两个组件共享数据,应用于我的应用程序意味着我希望 Orchestrator 能够访问 Streamer 捕获的推文。此外,我希望将这些数据存储在我的计算机本地目录MABSED/orchestrator/data/ 中,而不仅仅是在容器中,以防我在停止进程后需要访问该信息。

也就是说,我需要在我做docker-compose up时这两个容器获取MABSED/orchestrator/data/中存储的数据并添加相应的文件,这样Streamer在MABSED/orchestrator/data/streaming/添加新文件时,Orchestrator可以注意到这个变化并将新文件添加到MABSED/orchestrator/data/results/

还有startStreaming.py,这是Streamer服务运行的脚本,将数据保存到这个相对路径output_directory = '../orchestrator/data/streaming',它在本地工作正常,但我不知道它是否会在Docker容器上。

此时,我的docker-compose.yml 看起来像这样:

version: '2'

services:
  dashboard:
    build: demo-dashboard/
    ports:
     - "8080:8080"
    environment:
      - ES_ENDPOINT_EXTERNAL=http://localhost:9200
      - http.cors.enabled=true
      - http.cors.allow-origin=ES_ENDPOINT_EXTERNAL
      - http.cors.allow-headers=Content-Type, Access-Control-Allow-Headers, Authorization, X-Requested-With
      - http.cors.allow-credentials=true
    volumes:
     - ./demo-dashboard:/usr/src/app
    networks:
      - dashboard-network

  elasticsearch:
    image: docker.elastic.co/elasticsearch/elasticsearch:6.7.0
    environment:
      - bootstrap.memory_lock=true
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
      - http.cors.enabled=true
      - http.cors.allow-origin=http://localhost:8080
      - http.cors.allow-headers=Content-Type, Access-Control-Allow-Headers, Authorization, X-Requested-With
      - http.cors.allow-credentials=true
    ulimits:
      memlock:
        soft: -1
        hard: -1
      nofile:
        soft: 65536
        hard: 65536
    mem_limit: 1g
    cap_add:
      - IPC_LOCK
    volumes:
      - esdata1:/usr/share/elasticsearch/data
    networks:
      - dashboard-network
    ports:
      - 9200:9200

  orchestrator:
    image: orchestrator-mabsed
    build: orchestrator/
    environment:
      ES_HOST: 'elasticsearch'
    tty: true
    volumes:
      - ./orchestrator/data/:/usr/src/app/orchestrator/data

  streamer:
    image: streamer-mabsed
    build: streamer/
    tty: true
    volumes:
      - ./orchestrator/data/:/usr/src/orchestrator/data

volumes:
  esdata1:
    driver: local

networks:
  dashboard-network:
    driver: bridge

我想我需要创建一个卷来实现这一点,但我对 Docker 比较陌生,我不知道如何管理它。

这是我的 Streamer Dockerfile

FROM python:3.6

RUN pip3 install --user tweepy

WORKDIR /usr/src/app/
COPY startStreaming.py /usr/src/app/
COPY credentials.py /usr/src/app/

CMD python startStreaming.py

还有我的 Orchestrator Dockerfile

FROM python:3.6

COPY . /usr/src/app/
WORKDIR /usr/src/app/
RUN pip3 install --user -r requirements.txt

CMD python my_sched.py

【问题讨论】:

  • 您可以使用一些外部数据存储,而不是尝试使用文件系统;例如,主要将数据存储在 Elasticsearch 中?这样可以避免这个问题,更容易扩展服务,并且在集群环境中工作得更好。

标签: python docker docker-compose dockerfile


【解决方案1】:

您可以与您的服务共享同一个本地目录。
只需确保您的代码相应地引用该目录(共享路径)。
在这种情况下,/usr/src/app/orchestrator/data

示例:-

orchestrator:
image: orchestrator-mabsed
build: orchestrator/
environment:
  ES_HOST: 'elasticsearch'
tty: true
volumes:
  - MABSED/orchestrator/data/:/usr/src/app/orchestrator/data

streamer:
 image: streamer-mabsed
 build: streamer/
 tty: true
 volumes:
  - MABSED/orchestrator/data/:/usr/src/app/orchestrator/data

【讨论】:

  • 我编辑了docker-compose.yml,从问题中可以看出。现在 Streamer 工作了,文件在我的本地存储库中生成,尽管在容器中导航目录 /usr/src/orchestrator/ 不存在我不知道为什么。然而,Orchestrator 服务并没有意识到新文件已经被创建,因为它仍然要求一个已经存在的文件。知道我应该添加什么吗?
  • 在流媒体应用中,你能检查共享目录的路径吗?目前它是 - ./orchestrator/data/:/usr/src/orchestrator/data 不应该是 - ./orchestrator/data/:/usr/src/app/orchestrator/data
  • 我在该路径中映射了主机目录,因为我的 Streamer 脚本将文件本地保存在 ../orchestrator/data/streaming/ 中,并且我希望它在本地和容器中具有一致性。两个容器中的命运路径是否应该相同,还是只关心卷的源路径? @VineetPalan
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-05-16
  • 1970-01-01
  • 2020-10-06
  • 1970-01-01
相关资源
最近更新 更多