【发布时间】:2017-09-28 22:47:21
【问题描述】:
[我作为机器学习的局外人来处理这个问题。这似乎是一个分类问题,我应该能够通过机器学习以相当好的精度解决。]
训练数据集:
我有数百万个 URL,每个 URL 都标有特定类别。类别数量有限(50-100)。
现在给定一个新的 URL,我想将其归为其中一个类别。可以使用传统方法从 URL 确定类别,但需要大量难以管理的模式匹配。
所以我想构建一个输入为URL,输出为Category 的盒子。如何构建这个由 ML 驱动的盒子?
尽管我很想了解这在数学上如何解决的基本原理,但现在更多地专注于完成它,因此对所涉及的系统和流程的概念性理解是我所期待的得到。我认为机器学习正处于您可以以这种方式处理相当直接的问题的地步。
如果您觉得我错了,并且我需要深入了解基础才能从 ML 中获得价值,请告诉我。
我在 AWS 生态系统中构建它,所以如果它能让事情变得更快、更简单,我愿意使用 Amazon ML。
【问题讨论】:
标签: machine-learning classification amazon-machine-learning