【问题标题】:Capturing search data from other websites从其他网站捕获搜索数据
【发布时间】:2012-07-22 15:58:21
【问题描述】:

有没有办法从其他网站捕获搜索数据?例如,如果用户访问任何带有搜索字段的网站,我会对该用户在该搜索字段中输入的内容感兴趣以获取所需的博客文章/网页/产品。我想知道这是否可以通过抓取网站或任何其他方式来实现。此外,在第三方网站上执行抓取操作以记录此类数据是否违法?另外,如果使用 PHP 和 Python 可以做到这一点?

【问题讨论】:

  • 你能解释一下你为什么要这样做吗?这听起来像是对最终用户隐私的侵犯。
  • 请详细说明您的意思,这个问题不够清楚。据我了解,由于同源政策,您将无法查看用户在其他网站上所做的事情
  • 除非您以任何方式进入其他站点的站点或用户的浏览器,否则几乎无法获取该数据。
  • @Sam 无意伤害任何人。这在很多方面都是对隐私的侵犯,我得到了网站所有者的许可。它纯粹用于分析目的。但是,我真的很想完全从自己的角度来做这件事,而不是通过在第三方网站上放置 JS 代码或任何等效代码。

标签: php python search web-scraping


【解决方案1】:

您可以检查 http 引用并查看已将哪些值放入 GET 变量中,但这仅限于 GET 变量!

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-08-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多