【发布时间】:2013-08-16 13:22:08
【问题描述】:
我有点被这种情况困住了,我想找到网站的反向链接,我找不到怎么做,这是我的正则表达式:
readh = BeautifulSoup(urllib.urlopen("http://www.google.com/").read()).findAll("a",href=re.compile("^http"))
我想要做的是找到反向链接,就是找到以 http 开头的链接,而不是包含 google 的链接,我不知道如何管理这个?
【问题讨论】:
-
反向链接与指向页面 x 的链接一样吗?尝试使用 (SEO)moz API?
-
我想自己写脚本
-
如果您能够正确获取所有链接,您可以使用此正则表达式
(?!.*google)http.*检查已接受的链接。 -
@Sniffer 非常感谢 :),这很好,我还有很多东西要学 :)
标签: python regex beautifulsoup