【问题标题】:How to find inbound links to a given URL on the fly?如何动态查找到给定 URL 的入站链接?
【发布时间】:2010-09-29 08:47:53
【问题描述】:

Technorarati 有他们的 Cosmos api,它运作良好,但将您限制为非商业用途,每天查询不超过 500 个。

雅虎有一个Site Explorer InLink Data API,但它非常字面地定义了任务,从博客的侧边栏小部件返回链接,而不仅仅是来自博客内容的链接。

是否有其他方法可以跟踪谁链接到给定 URL(想想Techmeme.com 上的故事下方运行的讨论链接)?还是我必须自己动手?

【问题讨论】:

    标签: api screen-scraping tracking hyperlink


    【解决方案1】:

    这是指向您控制下的 URL 的链接吗?

    如果是这样,您可以快速创建一些在 Referrer HTTP 标头中记录条目的内容。

    如果您想在不更改应用程序代码的情况下对整个网站执行此操作,您可以为您选择的 Web 服务器实现 ISAPI 过滤器或等效项。

    网络爬虫提供的公开信息总是不完整和不可靠的(并不是说我的解决方案不...)。

    【讨论】:

      【解决方案2】:

      嗯,它不是一个 API,但如果你用谷歌搜索(例如):“link:nytimes.com”,返回的搜索结果会显示指向该网站的入站链接。

      我还没有尝试实现您想要的功能,但Google search API 几乎可以肯定内置了该功能。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2012-11-29
        • 1970-01-01
        • 2010-11-04
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多