【发布时间】:2020-10-22 19:51:05
【问题描述】:
在我的项目中,我需要找到在节点上处理的用户。
我有一个文件:jodIdUser。此文件中的内容有两列,例如:
395163 chem-yupy
395164 chem-yupy
395165 phy-xiel
395710 mae-chent
现在我有一个脚本 appRecord.sh,其中有一个 whle 循环。 while 方法代码如下:
cat $workDir/jobIdUser | while read LINE
do
jobUser=`echo $LINE | awk '{print $2}'`
jobId=`echo $LINE | awk '{print $1}'`
jobOnNodes=`/usr/bin/jobToNode $jobId | xargs`
echo $timeStr" "$jobId" "$jobUser" "$jobOnNodes >> $workDir/tmpRecFile
#20200702, it is needed to find out user process on nodes at this time here
designatedNode=`echo $jobOnNodes | awk '{print $NF}'`
echo $jobOnNodes
echo $designatedNode
ssh $designatedNode sh $workDir/nodeProInfo.sh ##Here code will exit while loop
echo $timeStr" "$jobId" "$jobUser" "$jobOnNodes >> $workDir/$recordFile
done
nodeProInfo.sh的代码如下:
#!/bin/bash
source /etc/profile
workDir=/work/ccse-xiezy/appRecord
hostName=`hostname`
jobInfo=`ps axo user:15,comm | grep -Ev "libstor|UID|ganglia|root|gdm|postfix|USER|rpc|polkitd|dbus|chrony|libstoragemgmt|para-test|ssh|ccse-x|lsf|lsbatch" | tail -n 1`
echo $hostName" "$jobInfo >> $workDir/proRes
现在我运行脚本 sh appRecord.sh,它是错误的。当第一个循环在while中时它会退出
[cc@login04 appRecord]$ sh appRecord.sh
r03n56 r04n09 r04n15
r04n15
[cc@login04 appRecord]$
不知道为什么远程ssh节点方法会退出,谁能帮帮我?
更新:
我有另一个运行正常的脚本。 jobIdUser 的内容如下:
r01n23 xxx-ser
r92n12 yyn-ser
while 循环是:
cat $workDir/jobIdUser | while read LINE
do
.............
ssh $NODE pkill -u -9 $USER
.............
done
【问题讨论】: