【发布时间】:2016-10-11 01:46:17
【问题描述】:
我有一个看起来像这样的文件 - http://pastebin.com/u1A7v1CV
这只是文件中两行的样本。
这些行包含word_label_id,后跟freq。
比如word_label_id1237在第一行出现1次,1390出现1次,以此类推……
我需要使用这种稀疏表示,但我无法将其转换为 DataFrame 或任何其他可用格式。
编辑:我知道 pandas 有一个 read_csv 方法,我可以使用空格作为分隔符。这并不理想,因为我需要两个分隔符 - word_label_id 和 freq 之间的一个分隔符和这对和下一个分隔符之间的不同分隔符。
【问题讨论】:
标签: python numpy text dataframe