【发布时间】:2019-12-18 10:12:00
【问题描述】:
我想创建一个 API,用户可以在其中输入一些输入,该 API(flask 应用程序)将通过机器学习(lin 回归,k 集群)给我一个预测结果。
在它可以预测结果之前,我需要先训练数据。我的数据集非常大(大约 50GB)。所以这意味着应用程序必须在每次用户输入输入时训练数据?这需要很长时间吧?
如何使用 Flask for ML 处理大型数据集?所以预测很快? 解决这个问题的最佳方法是什么?将 ML 用于 Web 应用程序? 我是新来的,所以任何帮助将不胜感激。
谢谢!
【问题讨论】:
-
为什么每次输入都需要重新训练?
-
我应该重新训练它吗?我不知道...我对此很陌生,但是步骤是什么?所以我训练我的数据,而 Python 保存训练后的数据?我应该如何通过 cronjob 训练我的数据?你能解释一下步骤吗?谢谢!
-
不,这个问题太宽泛了。但几乎可以肯定,每次获得新数据点时,您都不应该再次训练。
-
另一个建议是在Data Science Stack Exchange 中寻找可能的答案,因为当前的答案更侧重于您应该提出的特定编程问题,并提供代码示例作为问题的上下文。
标签: python python-3.x machine-learning flask