【发布时间】:2019-04-17 15:33:08
【问题描述】:
我从 Discourse API 检索到带有一些元素(p, span, div 等)的 HTML 字符串,其中一些具有 data-time, data-timezone, data-email-preview 等属性。我想要属性 data-email-preview 上的值,这些值是时间戳格式enter code here。这些值总是在 HTML 字符串中的前两个 span 元素之间。 HTML 字符串示例:
<p><span data-date="2019-05-10" data-time="19:00:00" class="discourse-local-date" data-timezones="Europe/Brussels" data-timezone="Europe/Berlin" data-email-preview="2019-05-10T17:00:00Z UTC">2019-05-10T17:00:00Z</span> → <span data-date="2019-05-10" data-time="22:00:00" class="discourse-local-date" data-timezones="Europe/Brussels" data-timezone="Europe/Berlin" data-email-preview="2019-05-10T20:00:00Z UTC">2019-05-10T20:00:00Z</span><br>
<div class="lightbox-wrapper"><div class="meta">
<span class="filename">HackSpace_by_Sugar_Ray_Banister.jpg</span><span class="informations">1596×771 993 KB</span><span class="expand"></span>
</div></a></div></p>
我需要提取span 元素之间的这两个日期:
2019-05-10T17:00:00Z 和 2019-05-10T20:00:00Z
【问题讨论】:
-
能否分享一下你目前尝试过的代码
-
不要使用正则表达式,使用像 jsoup 这样的库。stackoverflow.com/a/1732454/4785110