【发布时间】:2015-12-11 04:14:46
【问题描述】:
我需要用以下格式重命名许多文件:
509938_OPS001_ACTCGCTA-TCGACTAG_L001_R1_001.fastq.gz
我已经测试了我的正则表达式:
\d+\w([OPS]+\d+)[_]\w+-\w+[_](\d+)(\.fastq\.gz)
我尝试了以下脚本的多个版本,但每个版本都在 re.sub 之后引发语法错误。
import glob, re, os
for filename in glob.glob('some/dir/*.fastq.gz'):
new_name = re.sub(\d+\w([OPS]+\d+)[_]\w+-\w+[_](\d+)(\.fastq\.gz), r'\1_\2\3', filename)
os.rename(filename, new_name)
$python fastq_rename.py
File "fastq_rename.py", line 6
new_name = re.sub(\d+\w([OPS]+\d+)[_]\w+-\w+[_](\d+)(\.fastq\.gz)), r'\1_\2\3', filename)
^
SyntaxError: unexpected character after line continuation character
假设这与未转义的反斜杠有关,我用r' ' 将正则表达式括起来,这样可以避免错误,但不会更改文件名。
【问题讨论】: