【发布时间】:2014-04-22 05:22:09
【问题描述】:
最近我在做我的课程项目,这是一个安卓应用程序,可以根据用户的声音自动帮助填写消费表单。所以这里是一个例句:
所以我想做的是让应用程序自动填写表格,我的表格有几个字段:时间(昨天),位置(麦当劳),成本(10 美元),类型(食物)。这里的“类型”字段将包括食物、购物、交通等。
我已经使用分词库将句子分成几个部分并解析它,因此我已经可以从用户的语音中提取时间、位置和成本字段。
我想做的是用某种机器学习模型推断“类型”字段。所以应该事先有一些记录,由用户手动输入来训练模型。训练结束后,当新记录进来时,我先提取时间、地点和成本字段,然后根据模型计算类型字段。
但是我不知道如何表示位置字段,我应该使用字典来包含许多著名的位置并使用索引来表示位置吗?如果是,我应该使用哪种机器学习方法来建模这个需求?
【问题讨论】:
-
您需要查看自然语言处理。另见:nltk.org/book/ch05.html
-
@mskimm 已经用分词库分词,可以得到时间、成本、位置字段,但是不知道应该用什么机器学习模型来推导“类型”字段。
-
您要查找信息提取。这是一个序列标记问题——看看条件随机场作为一种技术
标签: machine-learning