【发布时间】:2018-03-12 15:58:54
【问题描述】:
我正在尝试编写一个 python 程序来计算网页上的单词。我使用 Beautiful Soup 4 来抓取页面,但我无法访问嵌套的 HTML 标签(例如:<div> 内的<p class="hello">)。
每次我尝试使用page.findAll()(页面是包含整个页面的Beautiful Soup 对象)方法找到这样的标签时,它根本找不到任何标签,尽管有。有什么简单的方法或者其他的方法吗?
【问题讨论】:
-
请显示您尝试过的一些代码。以及您尝试抓取的页面。
标签: python html beautifulsoup