【发布时间】:2013-05-07 07:32:15
【问题描述】:
我需要提取 HTML 文档正文中的所有粗体 sn-ps。我需要在服务器端使用 Java(而不是在浏览器上)
页面上的文本可以是粗体,因为标签例如<b>、<h1> 等,或者因为内联 CSS 样式 style="font-weight:bold;",或者因为使用 CSS 类的外部 CSS 样式。
我正在使用 Jsoup,但我也可以使用任何其他库来完成这项工作。
感谢您的宝贵时间!
【问题讨论】:
-
页面是否有定义的结构,或者它可以变化吗?如果可能,请发布一个示例 HTML 页面。
-
为什么要添加javascript的标签? Java会更合适吗?
-
如果您想在“服务器端”执行此操作,您应该将问题标记为“java”。 Jukka K. Korpela 花了一些时间为您提供了一个很棒的高质量解决方案,而您接受了一个有缺陷且便宜的解决方案,编辑您的问题和标签,使其“适合”解决方案。
-
我为那个 Slytael 感到抱歉。我的错!感谢您添加标签。