【发布时间】:2014-09-21 12:50:37
【问题描述】:
我想使用 Python 从检查元素中获取数据。我可以使用 BeautifulSoup 下载源代码,但现在我需要来自网页检查元素的文本。如果您能建议我如何做到这一点,我将不胜感激。
编辑: 通过检查元素,我的意思是,在谷歌浏览器中,右键单击为我们提供了一个名为检查元素的选项,其中包含与该特定页面的每个元素相关的代码。我想提取该代码/只是它的文本字符串。
【问题讨论】:
-
你必须更清楚地描述你想要做什么。什么是“检查元素”?请举例说明你想做什么。
-
它不使用 Python,但如果您在编辑器中右键单击蓝色突出显示的行,chrome 允许您
Copy as HTML。 -
有没有其他方法可以做到这一点,因为我必须在很多页面上这样做。此外,根据我的理解,复制为 HTML 仅针对单行执行。 @安德鲁约翰逊
-
不能把下载的html全部提取出来吗?
-
正确。
Copy as HTML只为您提供一页中选定的元素。下面我将提供一个简单的网络爬虫,它会自动通过 python 为您提供类似的输出。