【发布时间】:2011-01-09 16:19:50
【问题描述】:
是否有任何可用的编程库可以解析 HTML 文档、执行 JavaScript 并允许我浏览 DOM?这需要在服务器端执行,而不是客户端。任何语言都可以,但首选 Java、PHP 或 Ruby。
【问题讨论】:
标签: java php javascript ruby browser
是否有任何可用的编程库可以解析 HTML 文档、执行 JavaScript 并允许我浏览 DOM?这需要在服务器端执行,而不是客户端。任何语言都可以,但首选 Java、PHP 或 Ruby。
【问题讨论】:
标签: java php javascript ruby browser
node.js ?
Node 可以在其控制台中运行任何 javascript 文件。我会先尝试 node 看看它是否可以做你想做的事情,因为它可能拥有最大的用户群和文档。
【讨论】:
PhantomJS 可以做到这一点,并且可以与任何服务器端语言一起使用。请参阅下面的一些 NodeJS 和 PHP 集成模块
NodeJS
https://npmjs.org/package/node-phantom
https://github.com/sgentle/phantomjs-node
PHP
【讨论】:
从this post 开始并点击链接。或者只搜索 Rhino。
【讨论】:
【讨论】:
在java中:http://lobobrowser.org/cobra/java-html-parser.jsp
这是一个支持 Javascript、支持 CSS 的 HTML 解析器
与您的问题相关的最重要的功能:它是 Javascript 感知的。解析期间发生的 DOM 修改将反映在生成的 DOM 中。
【讨论】:
Java 已经支持 Rhino 的 javascript,也可以查看这个页面以获取服务器端 javascript 解决方案:http://en.wikipedia.org/wiki/Server-side_JavaScript
【讨论】:
PHP 有 DOMDocument 用于导航 DOM。我还没有听说过执行 JavaScript 的任何东西。
【讨论】: