【发布时间】:2020-07-20 11:57:27
【问题描述】:
我无法弄清楚为什么 BS4 在以下场景中看不到跨度内的文本:
- 页面:https://pypi.org/project/requests/
- 我正在寻找的文本 - 左侧的星数(撰写本文时大约 43,000)
我的代码:
stars = soup.find('span', {'class': 'github-repo-info__item', 'data-key': 'stargazers_count'}).text
也试过了:
stars = soup.find('span', {'class': 'github-repo-info__item', 'data-key': 'stargazers_count'}).get_text()
两者都返回一个空字符串''。元素本身似乎定位正确(我可以毫无问题地在 PyCharm 调试器中浏览父母/兄弟姐妹。在网站的其他部分获取文本也可以正常工作。只是与 github 相关的统计信息无法获取。
有什么想法吗?
【问题讨论】:
标签: python web-scraping beautifulsoup