【问题标题】:Creating an information repository referencing bot创建信息存储库引用机器人
【发布时间】:2013-08-18 02:43:40
【问题描述】:

我想创建一个机器人。有人会键入“!123”,机器人将在存储库中搜索值“123”并返回(粘贴)为该值找到的信息。我希望这是通用的..意味着它可以在任何地方使用,所以可能是某种 Firefox 插件。

谁能提供我可以从哪里开始的信息?

我对 c# 和 java 编程有所了解。

P.s 无意成为某种垃圾邮件机器人,我只是想收集一个人们可以轻松参考的信息。

【问题讨论】:

    标签: repository bots information-retrieval information-extraction


    【解决方案1】:

    您的项目有多个部分。

    1. 机器人将从网络上抓取数据并将数据保存在数据库中。 (假设您正在考虑从 Web 构建您的存储库)。 Google Web Crawler/scraper 为此。
    2. 数据提取器/清理器,它将清理数据并提取有关特定文档的相关信息。 (这很重要,以便您可以标记相关信息的信息)
    3. 然后是搜索引擎部分,它使您能够从存储库中检索相关数据。尝试vector similarity 算法

    【讨论】:

      猜你喜欢
      • 2021-02-13
      • 2020-09-28
      • 2021-02-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-02-19
      • 2023-03-04
      • 1970-01-01
      相关资源
      最近更新 更多