【发布时间】:2018-07-03 12:08:10
【问题描述】:
我正在尝试通过 BeautifulSoup 获取我在 Telegram 上的帖子的浏览量。例如,我想从我的频道帖子编号 956 中获取它:https://t.me/dayygesstt/956
<span class="tgme_widget_message_views">3.1K</span>
所以“3.1K”是我需要的。
import requests
from bs4 import BeautifulSoup
def get_html(url):
r = requests.get(url,'lxml')
return r.text
url='https://t.me/dayygesstt/956'
html=get_html(url)
soup=BeautifulSoup(html, )
x = soup.findAll("div", {"class": "tgme_page tgme_page_post"})
for i in x :
r=i.findAll("div", {"class": "tgme_page_widget"})
print(r)
然后打印出来:
[<div class="tgme_page_widget" id="widget">
<script async="" data-telegram-post="dayygesstt/956" data-width="100%" src="https://telegram.org/js/telegram-
widget.js?4"></script>
</div>]
我尝试了不同的方法,但无法获得更多信息。请帮助我,我做错了什么?如何正确获取信息?
【问题讨论】:
-
它不起作用,因为该 div 元素的内容是使用 javascript 动态加载的。
-
谢谢,我该怎么办?
标签: python python-3.x parsing beautifulsoup telegram