【发布时间】:2017-04-18 06:47:10
【问题描述】:
最近我开始做一些关于标准化产品数据的研究。
超市经常以不同的价格出售相同的产品,比较这些价格很有用。为此,我们需要知道我们正在匹配每个超市的相同产品。问题是,超市在命名产品和在网站上列出产品的方式上往往存在细微差别。我们需要一个可以标准化产品名称的工具,将两个不同名称的产品识别为同一产品,同时成功识别不同但名称相似的产品以及数量上的差异。例如,我想购买 rasher,当你去搜索 rasher 时,我们将对所有 rasher 进行编码,即使名称不同并映射到 HS-codes ,我想知道这个过程背后的技术是什么?
此外,我们需要将这些产品的价格转换为标准单位,并使产品与世界贸易 HS 编码定义的组保持一致。假设 raser 的价格是每 180 克 2.99 欧元,但现在我想通过一些技术将其更改为每公斤 16.62 欧元,检查适当的自然语言技术以确定哪种方法最能实现这些目标。
【问题讨论】:
标签: machine-learning nlp