【发布时间】:2017-02-13 21:07:28
【问题描述】:
我确实在 Azure 中设置了带有 1 个头节点和 2 个计算节点的 Azure HPC 集群,运行良好。我可以从 Excel 提交作业,完美返回结果。
现在,我正在尝试自动扩展集群,我已将证书上传到 Azure 订阅并更新了头节点上的证书存储和注册表,如此处所述。
我已经使用 PS 设置了 AutoGrowShrink 属性,它似乎也设置正确。
PS C:\Program Files\Microsoft HPC Pack 2012\Bin> Get-HpcClusterProperty -AutoGrowShrink
Name Value
---- -----
EnableGrowShrink True
TasksPerResourceUnit 1
GrowThreshold 1
GrowInterval 3
ShrinkInterval 5
ShrinkIdleTimes 3
ExtraNodesGrowRatio 1
GrowByMin True
SoaJobGrowThreshold 50000
SoaRequestsPerCore 20000
但是,当我提交需要更多内核的作业时,它会永远排队,并且不会将新的计算节点添加到 HPC 集群中(AutoGrowShrink 不会触发)。知道我可能缺少什么。
【问题讨论】: