【发布时间】:2015-05-13 10:17:57
【问题描述】:
我想这并不难,但我真的被困住了。 我有一些文件,用一串 9 个数字命名,例如:
003485295.lst
005847283.lst
092348235.lst
...
每个文件都标识一个测量站,并包含一个包含两列的表格,date 和 value,由空格字符分隔。例如,003485295.lst 是:
date value //header row here!
2014-01-03-07:00-00 2.2
2014-01-04-07:00-00 3.1
2014-01-05-07:00-00 28.6
2014-01-06-07:00-00 2.5
2014-01-14-07:00-00 5.6
...
有些日期在所有文件(电台)中是通用的,但有些不是。
我在寻找什么
我选择了一个特定的日期,比如2014-01-06。我想:
- 创建一个空的结果文件,比如
2014-01-06.txt; - 循环浏览我的所有
*********.lst文件; - 搜索站
********当天是否进行了一些测量MM.M; - 在我的结果文件中添加一行,遵循模式 stationId-value,例如
******** MM.M(也可以是M.M或MMM.M)。
因此,所需的输出 2014-01-06.txt 类似于:
003485295 2.5 //as we read in 003485295.lst
001022903 6.4
001022905 6.6
001022907 10.3
001026202 30.6
...
应排除在当天没有任何价值的电台。我在 Windows 上,手上有 R 和 MATLAB,但也可以使用其他工具。
【问题讨论】:
-
你的 lst 文件的体积是多少,每个文件有多少数据(只是为了建议一种可扩展的方法)?
-
现在不是很大,大约。 100 个 lst 文件,每个文件不超过 200 行。