【发布时间】:2013-07-19 23:50:22
【问题描述】:
我正在寻找一个库来帮助 mi 从用户代理中提取特征以用于 Hadoop(Pig 或 Hive)。我主要对移动用户感兴趣。
我希望能够提取如下特征:
- 操作系统版本
- 浏览器版本
- 屏幕尺寸
- 供应商名称
- 型号名称
- 等...(用户代理中未明确给出的功能)
我正在考虑使用 WURLF 或 OpenDDR 之类的项目,但它们提供的 API 可在我的 Hadoop 作业中使用,由于需要外部服务器来提供该 API,因此效果不是很好。
如果您知道这样的项目,请告诉我,或者我正在寻找如何有效地将 WURLF 或 OpenDDR 与 Hadoop 一起使用的解决方案。
【问题讨论】:
标签: parsing hadoop user-agent