【发布时间】:2019-12-18 03:30:39
【问题描述】:
所以我昨天的程序正在运行,我保存并关闭它,现在它没有。第一个 for 循环应该从谷歌搜索中附加网站链接,现在它根本不运行循环
import bs4
import requests
def Google(word):
linkelem = []
strlink = []
httplink = []
extractedhttp = []
brokenlinks = []
websiteheadlines = []
websitebody = []
res2 = requests.get(f'https://google.com/search?q={word}')
res2.raise_for_status()
soup2 = bs4.BeautifulSoup(res2.text, 'html.parser')
#print(soup2)
for div in soup2.find_all("div", {"class": "jfp3ef"}):
for link in div.select("a"):
linkelem.append(link)
我需要它将链接附加到列表“linkelem”中
这是不工作的部分,还有更多内容,但这一切都依赖于第一部分来工作。如果我需要添加其余部分,尽管我可以。我尝试在 for 循环中添加打印语句,但它没有打印它们。我不知道那之后该怎么办。
【问题讨论】:
-
相当肯定
jfp3ef是一个随机类,它不时更改以防止像你这样的机器人。查看您请求的此页面的源代码,我在任何地方都找不到。 -
另外你也不应该像这样废弃他们的网站,他们为developers.google.com/custom-search/v1/overview提供了适当的API
-
啊拍摄我不知道,这非常有帮助,非常感谢! @Havenard
标签: python for-loop beautifulsoup request