【发布时间】:2012-01-16 08:33:33
【问题描述】:
不知道从哪里开始,所以希望你们能解决我的问题。我有一个项目,将在其中搜索电子邮件以查找特定的单词/模式并以结构化的方式存储。用Trip it 完成的事情。
The article states他们开发了一个DataMapper
DataMapper 负责接收入站电子邮件消息 针对 [at] tripit.com 的计划,并将其从 您在邮件阅读器中看到的半结构化格式 结构化的 XML 文档。
有一条评论也说明了
如果您想自己构建它,请阅读一些关于 Wrappers 和 Wrapper Induction 可能会有所帮助
我在 Google 上搜索并阅读了有关包装器归纳的信息,但它的定义过于宽泛,并没有帮助我理解如何解决此类问题。
是否有一些开源项目可以做类似的事情?
【问题讨论】:
-
要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题是Stack Overflow 的题外话,因为它们往往会吸引固执己见答案和垃圾邮件。相反,请描述问题以及迄今为止为解决该问题所做的工作。
标签: nlp data-mining text-processing data-scrubbing