【问题标题】:Relation of between CPU vCores and spark executor-coresCPU vCores 和 spark executor-cores 之间的关系
【发布时间】:2023-03-16 12:34:01
【问题描述】:

我正在启动一个具有 m5.xlarge 核心节点的 EMR 集群,如下所示:

4 vCore, 16 GiB memory, EBS only storage
EBS Storage:200 GiB

我不确定我是否运行 Spark 作业并设置 executor-core 参数,例如 2。这是否与我的 m5.xlarge 实例中的 vCores 完全相同?

【问题讨论】:

    标签: amazon-web-services apache-spark amazon-ec2


    【解决方案1】:

    每个执行器的核心将在您的集群中使用一个 vCore,因此创建 4 个每个 1 个核心的执行器或 2 个每个 2 个核心的执行器或 1 个 4 个核心的执行器。尽情享受吧!

    【讨论】:

    • 有点奇怪.. 我有 9 个 m5.xlarge 实例和总共 36 个 vcore(加上具有 4 个 vcore 的主节点),但我可以运行一个包含 75 个实例的 spark 作业,每个实例有 2 个纱线上的执行器核心..
    • 你必须知道你在那里运行的其他服务是什么,当然有必要在你的计算中包括驱动程序。您总共有 36 个 vcore,除以 9 个实例吗?我不明白。
    【解决方案2】:

    对于大多数实例,AWS 将 1 个核心定义为 1 个 vCPU。我相信这和vCore是一样的

    ““每个 vCPU 都是 Intel Xeon 内核的超线程,T2 除外。”

    换句话说,对于 T2 实例,1 个 vCPU = 1 个物理内核。对于所有其他人,1 个 vCPU = 1 个逻辑核心。当涉及到多线程、突发 CPU 使用率时,这可能会导致显着的性能差异。”

    参考:https://www.credera.com/insights/whats-in-a-vcpu-state-of-amazon-ec2-in-2018#:~:text=%E2%80%9CEach%20vCPU%20is%20a%20hyper,%2Dthreaded%2C%20burst%20CPU%20usage

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-09-25
      • 1970-01-01
      • 1970-01-01
      • 2021-04-20
      • 2015-07-13
      • 1970-01-01
      相关资源
      最近更新 更多