【发布时间】:2022-01-12 16:47:22
【问题描述】:
我有 336 个 txt 文件,每个 txt 文件有 4 列。我需要帮助来查找所有 txt 文件中第 2 列(基因)中常见或匹配的字符串,并将该信息提取到新的 txt 文件中。
例如:“kdpDE beta”存在多少次,如果存在则在输出 txt 文件的下一列中打印“1”,如果“kdpDE beta”不存在则打印“0”。
感谢您的帮助。
File_1.txt
Name Gene Family Class
KB2908 kdpE beta aminoglycoside lactamase
KB2908 ugd peptide transferase
File_2.txt
Name Gene Family Class
KB2909 kdpE beta aminoglycoside lactamase
KB2909 ugd peptide transferase
KB2909 PmrF macrolide phosphotransferase
【问题讨论】:
-
我不明白这个过程的结果应该是什么。是否有一个输出文件,还是每个文件都被修改为新列?
-
嗨@glennjackman,一个输出文件,每个txt文件中匹配字符串的出现次数