wangnengwu

简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点;

1 LSF常用作业管理命令:

作业提交bsub

查看自己运行的所有作业的情况bjobs

跟踪某任务屏幕输出bpeek

bkill 杀死某个作业

bqueues作业队列情况

bstop停止挂起作业

bresume 恢复挂起作业

lshost查看节点信息

bhosts查看所有节点作业信息

lshosts查看所有节点负载信息

busers 查看用户最大可用核心以及用户作业情况,比如busers  hubo.huang(hubo.huang是用户名)

 

作业脚本范例:

计算任务是通过脚本文件提交到作业管理系统的(也即是在pac管理平台提交,pac管理平台有作业脚本范例),脚本文件是一个可执行文件;

脚本参数说明:

1作业要使用的队列 2作业需要的核心数 3每节点分配给作业运行的核心数 

lsf一般有主节点,和从节点,防止作业管理单点故障;

 

分类:

技术点:

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-03-06
  • 2021-12-02
  • 2022-12-23
  • 2021-07-26
  • 2021-12-04
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-12-19
  • 2021-05-11
  • 2022-12-23
  • 2021-07-12
  • 2021-05-28
相关资源
相似解决方案