【发布时间】:2016-09-22 08:47:35
【问题描述】:
我们有一个非常大表,我们正在使用 SSAS 数据挖掘对其进行预测。
我们正在努力以有效的方式获得评分的测试和训练案例以进行验证。有没有办法不调用每一行的算法(PREDICTION JOIN)?
例如,如果我的输入数据集有以下列:
(客户、国家、年龄、性别、购买金额)我想获得...
(客户、国家、年龄、性别、BuyAmount、BuyAmountPredicted、概率)
它必须是可能的,因为这是在模型处理期间完成的,它可能用于生成验证图表,例如SystemGetClassificationMatrix。
如果我们谈论的是数十亿行,这将是一个巨大的性能提升。
- 避免重复计算(预测连接将针对每一行执行模型)
- 避免使用 openrowset 将数据从 DB 移动到 SSAS(案例已保存在 model.cases 中)
- 避免将结果写回某处以供将来分析
这应该是微不足道的问题......我一定错过了什么。
【问题讨论】:
标签: machine-learning ssas regression