【发布时间】:2018-09-06 11:15:28
【问题描述】:
我试图从谷歌地图中获取元素所在的链接:
<div class="something1">
<span class="something2"></span>
<a data-track-id="Google Map" href="https://www.google.com/maps/dir//11111/@22222" target="_blank" class="something3">Google Map</a>
</div>
我只想得到https://www.google.com/maps/dir//11111/@22222
我的代码是
gpslocation = []
for gps in (secondpage_parser.find("a", {"data-track-id":"Google Map"})):
gpslocation.append(gps.attrs["href"])
我正在使用 2 个 url 页面(主页和第二页)来抓取位于第二页中的博客网站。故事标题或作者姓名等其他信息以文本形式显示,因此我可以使用 get_text()。
但是在这种情况下,我无法获得href 之后的链接。请帮忙。
附言。如果我只想要链接中的纬度和经度(11111 和 22222),有没有办法使用str.rplit?
非常感谢
【问题讨论】:
标签: python python-3.x web-scraping beautifulsoup jupyter-notebook