【发布时间】:2018-10-10 23:39:43
【问题描述】:
我正在尝试使用 tensorflow 构建基于回归的 M/L 模型。
我正在尝试根据以下内容估算对象的 ETA:
- 与目标的距离
- 与目标的距离(X 分量)
- 与目标的距离(Y 分量)
- 速度
对象在特定的旅程中旅行。这可以表示为从 A->B 或从 A->C 或从 D->F (POINT 1 -> POINT 2)。有 500 个特定的旅程(在一组点之间)。 这些旅程并不完全是直线,而且每条旅程都是不同的(即所走路线的形状)。
我有两种方法可以解决这个问题:
- 我可以拥有 500 个具有 4 个特征和一个标签的不同模型(训练 ETA 数据)。
- 我可以拥有 1 个具有 5 个特征和一个标签的模型。
我的困境是,如果我使用选项 1,这会增加复杂性,但会更准确,因为每个模型都特定于每个旅程。
如果我使用选项 2,模型将非常简单,但我不知道它是否能正常工作。我要添加的新功能是 originCode+ destinationCode。不幸的是,这些都无法量化以产生任何数字意义或模式——它们只是定义旅程的文本(旅程 A->B,特征是“AB”)。
有什么方法可以让我使用一个模型,并对特征进行分类,使一个特征只是一个“分组”特征(以便将训练数据与旅程分开。
【问题讨论】:
-
你对路线“形状”有任何了解吗?似乎可以从中收集到一些有趣的功能。
-
另外,您的数据中每条路线有多少“行程”?
-
看来“到目前为止在路线上花费的时间”也很有用。
标签: tensorflow machine-learning