【发布时间】:2018-10-05 14:31:24
【问题描述】:
我想从 URL 中提取引用。
例如,我的网址如下所示:
"https://www.amazon.es/Lenovo-YOGA-520-14IKB-Ordenador-convertible/dp/B071WBF4PZ/"
我只想获取参考部分,即B071WBF4PZ
我还想从这个 html 元素中提取价格:
"<div id="cerberus-data-metrics" style="display: none;" data-asin="B078ZYX4R5" data-asin-price="1479.00" data-asin-shipping="0" data-asin-currency-code="EUR" data-substitute-count="0" data-device-type="WEB" data-display-code="Asin is not eligible because it has a retail offer" ></div>"
我只需要获取属性data-asin-price的值。
可以使用indexOf',substringorsplit` 来完成,但我不知道该怎么做。
【问题讨论】:
-
这两个例子完全不同:计算机怎么知道如何得到你想要的信息? (您想要 URL 的最后一部分还是某些标签之间的部分,还是其他?)
-
这些例子来自一个页面,来自我想要的最后一部分,即参考 B071WBF4PZ 在 '/' 之间的 URL,而第二部分只有 data-asin-price = 引号之间的部分“1479.00”,价格为 1479.00 谢谢
-
你的问题是真的解析字符串,还是你的上下文是什么?例如。如果你使用 Spring,Spring 会自动为你解决这个解析。
-
和 Spring 一样??
-
您是否尝试从
HTML页面抓取数据?
标签: java split substring indexof