【发布时间】:2017-09-17 21:50:28
【问题描述】:
我们正试图弄清楚如何在 GCP 中托管和运行我们现有的许多 scikit-learn 和 R 模型(原样)。似乎 ML Engine 非常特定于 Tensorflow。如果数据集太大而无法拉入 datalab,如何在 Google 云平台上训练 scikit-learn 模型并管理我的模型?我还能继续使用 ML Engine,还是大多数人采用不同的方法?
作为更新,我能够通过将 scikit-learn 模型作为训练作业提交给 ML Engine 来获得训练 scikit-learn 模型运行的 Python 脚本,但还没有找到托管腌制模型或将其用于预测的方法.
【问题讨论】:
-
这取决于您的用例。什么是大数据集?如果使实例更大,它是否可以放入 datalab 实例的内存中?这是最简单的解决方案。如果没有,可能是时候寻找更合适的工具了——比如 TF Learn,或者 Spark MLlib。
标签: scikit-learn google-cloud-platform google-cloud-ml-engine