【发布时间】:2011-03-11 07:23:20
【问题描述】:
我想在 R 中使用许多(例如 10 万个)特征进行大规模回归(线性/逻辑),其中每个示例在特征空间中相对稀疏——例如,每个样本约 1k 个非零特征例子。
似乎SparseM 包slm 应该这样做,但我在从sparseMatrix 格式转换为slm 友好格式时遇到了困难。
我有一个标签的数字向量y 和一个sparseMatrix 的特征X \in {0,1}。当我尝试时
model <- slm(y ~ X)
我收到以下错误:
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
大概是因为slm 想要一个SparseM 对象而不是sparseMatrix。
是否有一种简单的方法来 a) 直接填充 SparseM 对象或 b) 将 sparseMatrix 转换为 SparseM 对象?或者也许有更好/更简单的方法来做到这一点?
(我想我可以使用 X 和 y 显式编写线性回归的解决方案,但如果有 slm 工作会很好。)
【问题讨论】:
标签: r sparse-matrix regression