【发布时间】:2021-05-03 20:03:19
【问题描述】:
Beautiful Soup 的新手将不胜感激。
我正在处理一个包含很多内容的页面:
<p data-v-04dd08f2> .. </p>
元素。 p 里面是一个字符串值,我需要它和一个嵌入的跨度。
问题可能很简单...我正在尝试使用 find_all 来“获取”所有这些元素的列表,随后我将解析这些元素以从内部获取我需要的令牌。
谁能让我摆脱痛苦并告诉我应该如何构建 find_all 来获得这些?
我试过了:
find_all('p',{'data':'v-04dd08f2'} } # nope
find_all('p', {"attributes': 'v-04dd08f2'} ) # nope
还有很多其他的组合都无济于事。
谢谢!
【问题讨论】:
标签: python beautifulsoup screen-scraping