【发布时间】:2016-03-20 19:44:04
【问题描述】:
我有 200 个文本文件,结构如下:
n01443537_0.JPEG 0 10 63 58
...
n01443537_499.JPEG 0 3 39 42
在每个文件中,第一部分(在下划线之前,即 n01443537)是不同的。但是,它们都具有相同的结构,即以 n 开头,后跟八位数字。
我希望将所有 200 个文件格式化如下:
n01443537/n01443537_0.JPEG n01443537
...
n01443537/n01443537_499.JPEG n01443537
我发现这个正则表达式 n[^_]* 捕获了所需的模式,但是将它们放在一起有点麻烦。
【问题讨论】:
-
你对每一行的其余信息做了什么? (例如
' 0 10 63 58')? -
我只是删除了那些数据