【发布时间】:2014-05-03 02:14:06
【问题描述】:
我有一个凌乱的文件,其中一些列是制表符分隔的,有些是逗号。
我的数据集问题是读取可变长度的文件
12 Stephen Cole, 33, Columbia, MO
5 Dave Anderson, 25*, Concord, OH
第一列是ID(制表符)、姓名(逗号)、年龄(逗号)、活动(年龄后有星号)、家(制表符)
年龄后的*表示他们是否处于非活动状态。
所有名称都从@19 列开始,但之后的所有内容都是可变长度且列开始。
我想读成我最终得到的格式。
ID Name Age Active Home
12 Stephen Cole 33 Active Columbia, MO
5 Dave Anderson 25 Inactive Concord, OH
到目前为止,我有:
data marathon;
infile 'c:/file.txt' dlm=',' pad firstobs=12;
input @3 ID 3. @19 Name $CHAR13.;
然后我被困在如何阅读其余部分。我主要被如何阅读年龄旁边的星号作为自己的专栏。如果我明白这一点,我想我可以处理剩下的。
【问题讨论】:
-
修复了您的数据。如果那些
<br>字段应该在那里,请将它们放回去 - 我假设您将它们用于布局目的。
标签: sas