【发布时间】:2025-11-29 07:35:01
【问题描述】:
我有一个如下所示的数据框:
ERR843978.19884 13 51 51
ERR843978.2880 10 49 51
ERR843978.10002 7 48 55
ERR843978.1158 8 45 54
ERR843978.4671 14 62 60
ERR843978.83 15 56 70
ERR843978.9406 8 56 39
ERR843978.8383 12 59 43
ERR843978.8916 6 51 42
我希望对所有行都这样做:
column2/(column3*column4)
然后在新文件中打印输出。
我已经编写了一个 bash 脚本,但它有点慢,所以我正在寻找一个更有效的解决方案(也许使用 awk?)。
这是我的代码
while read line
do
out0=$(awk '{print $1}' <<< $line)
out1=$(awk '{print $2}' <<< $line)
out2=$(awk '{print $3}' <<< $line)
out3=$(awk '{print $4}' <<< $line)
out4=`echo "scale=5; ($out1 / ($out2 * $out3))"|bc -l`
echo "$out0;$out4"
done < $file
【问题讨论】:
-
如果第三列和第四列为零怎么办?编辑以显示所需的内容
-
顺便说一句:没有 awk 和 bc:使用 div function 和
while read -r c2 c2 c3 c4; do div $c2 $((c3*c4)); done < file -
请参阅unix.stackexchange.com/questions/169716/…,了解您的脚本为何如此缓慢,以及为什么在处理文本时通常要避免 shell 循环。
标签: bash shell unix dataframe awk