【发布时间】:2021-04-08 23:35:19
【问题描述】:
我有一个带有两个变量 X 和 Y 的 pandas 数据框(大约 1M 行),并且希望使用 scipy,sparse 创建一个稀疏矩阵。输出应该是一个 n x m 矩阵,如果 X = x 且 Y = y,则其条目为 1。
下面是一个数据结构的例子
import pandas as pd
data = [[1256, 10], [3087, 15], [2199, 14], [2199, 10], [1256, 15], [3087, 14], [1056, 10], [408, 15], [1256, 14]]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns = ['X', 'Y'])
# print dataframe.
df
想要的输出是
10 15 14
1256 1 1 1
3087 0 1 0
2199 1 0 1
3087 0 0 1
1056 1 0 0
408 0 1 0
提前致谢
【问题讨论】:
-
你的输出中有两行
3087,你能解释一下原因吗? -
对不起,这是我的错误