【发布时间】:2014-11-20 18:29:11
【问题描述】:
我想从一个节点中提取多个 url 并将它们放入一个字符串数组中。目前我正在将所需节点中的所有文本保存到一个字符串中;
imgsUrl= value.text
然后我正在解析字符串并获取正确的 url。
imgsUrl[imgUrl.find("http://"):imgUrl.find(".JPG")+4]
我的问题是我可能需要来自 imgsUrl 的 1-200 个 url,而我只能获得其中一个。有没有一个好的解决方案可以将它们全部放入一个不那么乏味的数组中?
样本输入:
sampleStr="<ul><li><a href="http://website/abc/vcd/HHD00300.JPG">HHD00300.JPG</a></li>
<li><a href="http://website/abc/vcd//HHD003002.jpg">HHD003002.jpg</a></li></ul>"
输出:
print imgUrlSubString
outputs this: http://website/abc/vcd//HHD003000.JPG
预期输出:
['http://website/abc/vcd//HHD003000.JPG','http://website/abc/vcd//HHD003002.JPG',....]
【问题讨论】:
-
您可以发布示例输入和预期输出吗?
-
正则表达式应该可以解决问题。请参阅 [this][1] 答案。 [1]:stackoverflow.com/a/6883094/447599
-
@vikramls 好的示例输入和相应的输出已包含
-
@Julius 这似乎工作得很好。这是 niroyb 下面提到的类似方法吗?如果是这样,我想将其中之一标记为答案。谢谢!