【发布时间】:2014-02-22 01:33:17
【问题描述】:
有没有办法提取DOM元素的渲染信息,比如位置、字体、颜色等?例如,一个 HTML 文件可能不指定标签的坐标,但 Web 浏览器引擎会以某种方式计算它们的位置和相对大小。我想知道如何让程序访问这些信息
我知道我可以手动访问渲染信息,例如,在 Google chrome 中使用“检查元素”,但我想知道是否有任何可编程方式。
谢谢
ps。我想我必须提供这个任务的上下文。我目前正在对 HTML 网页中的结构化数据(例如表格)进行信息提取,并且正在考虑使用视觉信息(例如表格元素的位置)来提取结构化信息。
【问题讨论】:
-
这基本上需要模拟浏览器在渲染中所做的大部分工作,这实际上取决于您将使用的编程语言和工具。一个非常广泛的问题。
标签: html dom information-extraction