【发布时间】:2017-01-07 03:43:59
【问题描述】:
我正在尝试从 Go 中的磁盘读取一个表,其中包含混合整数和浮点数,其中每个字段的宽度是固定的(每个字段占据固定数量的位置,如果太短,则前面有空格)并且其中一些值可能会丢失(并且应该默认为零)。
文件在这里:https://celestrak.com/SpaceData/sw20100101.txt
用于读取它的 Fortran 格式写在标题中:
FORMAT(I4,I3,I3,I5,I3,8I3,I4,8I4,I4,F4.1,I2,I4,F6.1,I2,5F6.1)
这些行看起来像这样(最后几行,有空格):
2014 12 29 2475 2 20 30 23 33 37 47 33 47 270 7 15 9 18 22 39 18 39 21 1.1 5 64 127.1 0 150.4 156.0 131.4 153.3 160.9
2014 12 30 2475 3 30 40 37 20 30 27 27 23 233 15 27 22 7 15 12 12 9 15 0.8 4 66 126.0 0 150.3 156.1 130.3 152.7 161.0
2014 12 31 2475 4 13 23 13 17 20 33 13 17 150 5 9 5 6 7 18 5 6 8 0.4 2 65 129.2 0 150.5 156.3 133.6 152.4 161.3
2015 01 01 2475 5 20 10 10 10 10 20 20 30 130 7 4 4 4 4 7 7 15 6 101 138.0 0 150.7 156.6 142.7 152.1 161.7
2015 01 02 2475 6 30 10 20 20 30 20 30 40 200 15 4 7 7 15 7 15 27 12 113 146.0 0 150.9 157.0 151.0 152.2 162.1
2015 01 03 2475 7 50 30 30 30 30 20 20 10 220 48 15 15 15 15 7 7 4 15 122 149.0 0 151.0 157.2 154.1 152.4 162.4
我一直在尝试一个巧妙的格式字符串来与 Sscanf 一起使用(例如“%4d%3d%3d%5d...”),但它不适用于空格,或者如果数字没有右对齐它的插槽。
我正在寻找一种像在 Fortran 中那样阅读它的方法,其中:
- 可以使用混合字段类型(整数、浮点数、字符串)。
- 每列都有固定的字符大小,必要时用空格填充空格,但不同的列可能有不同的大小。
- 数值前面可以有零。
- 可能缺少值,在这种情况下,它会给出零值。
- 值可以位于槽中的任何位置,不一定是右对齐(不是示例,但可能)
是否有一种聪明的方法来阅读这样的内容,或者我应该手动拆分、修剪、检查和转换每个字段?
【问题讨论】:
-
我认为拆分/修剪方法是您最好的选择。当您读入它时,看起来字节的顺序是标准化的,因此您可以为每一行运行一个循环,该循环只为每一行抓取字节 n 到 n+x 并相应地转换它们。例如:
date, _ := time.Parse("2006 01 02",string(bytes[0:9]))并继续使用val := strconv.Atoi(string.TrimSpace(string(bytes[n:n+x])))等。