【发布时间】:2014-03-06 17:45:55
【问题描述】:
我有一个名为“test.txt”的文本文件,其中包含 libsvm 格式的数据。 该文件中的数据表示如下:
165475 0:246870 1124384:2 342593:7 1141651:1 297582:1 1186846:1 17725:1 656602:1
463304:1 766612:1 573309:1 290046:1 748198:1 216665:1 950594:2 909004:1 29008:1
105623:1 5018:5 806027:1 1125729:1 757846:1 1023921:2 612980:1 120767:1 51340:1
108172:5 674420:2
其中第一项代表标签,其余代表特征及其权重(由 : 分隔)。这是一个非常大的文件(每个标签都有很多特征和权重)。
我正在将 scikit 与 ipython notebook 一起使用,并希望将这些数据加载到 notebook 中以开始处理它。
有人能告诉我怎么做吗。提前谢谢。
【问题讨论】:
标签: scipy ipython scikit-learn libsvm ipython-notebook