【发布时间】:2016-08-27 00:18:54
【问题描述】:
您可能会对这句话做出反应,即使用正则表达式进行 HTML 解析是一个完全坏主意,例如遵循 this,您是对的。
但在我的例子中,下面的 html 节点是由我们自己的服务器创建的,所以我们知道它总是看起来像这样,因为正则表达式将在 移动 android 库中,所以我不知道不想使用 Jsoup 之类的库。
我要解析的内容:<img src="myurl.jpg" width="12" height="32">
应该解析什么:
- 匹配一个常规的img标签,并分组src属性值:
<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*> - 宽度和高度属性值:
(width|height)\s*=\s*['"]([^'"]*)['"]*
所以第一个正则表达式将有一个带有 img url 的 #1 组,第二个正则表达式将有两个匹配其值的子组。
如何合并两者?
期望的输出:
- 图片网址
- 宽度值
- 高度值
【问题讨论】:
-
你想要 this 吗?
-
"下面的 html 节点是由我们自己的服务器创建的" 所以将服务器改为返回 JSON。服务器始终是用来完成繁重工作的,而不是移动设备。
-
@rock321987:你的更简单,也许对于 OP 来说已经足够了。另外,我不确定需要什么确切的输出。
-
我已经更新了帖子,我认为@rock321987 已经得到了答案