【问题标题】:How does copyscape protect itself from captcha? [closed]copyscape 如何保护自己免受验证码的影响? [关闭]
【发布时间】:2014-09-14 04:10:49
【问题描述】:

www.copyscape.com 使用 google api 搜索重复的内容。这怎么可能? 如果我使用 file_get_contents($google_search_url),它可以工作。但经过一番搜索后,它停止工作。我发现一些地方被告知 compyscape 将其 ip 隐藏到谷歌。但是他们如何从谷歌接收数据。

【问题讨论】:

标签: php


【解决方案1】:

Copyscape 不使用 Google API,而是使用 Google 搜索,它在此处向 http://www.google.com/search?q=Search 关键字发出简单的 curl 请求。然后使用正则表达式模式来查找标题、描述和链接并显示给用户。但这严重违反了谷歌的服务条款,这也会让他们被禁止,所以他们使用代理(或任何其他 ip 隐藏方法)来隐藏他们每次搜索的 ip。

【讨论】:

  • 能否分享一个简单的代码(如何搜索google隐藏ip?)
猜你喜欢
  • 2010-12-25
  • 1970-01-01
  • 2023-03-31
  • 2012-04-05
  • 2018-07-24
  • 2017-05-18
  • 1970-01-01
  • 1970-01-01
  • 2010-10-01
相关资源
最近更新 更多