【发布时间】:2014-11-21 18:11:13
【问题描述】:
我正在使用 Python 和 BeautifulSoup 库抓取页面。
我必须只从这个字符串中获取 URL。这实际上在a 标签的href 属性中。我已经抓取了它,但似乎找不到从中提取 URL 的方法
javascript:void%20window.open('/Sheraton-Tucson-Hotel-177/tnc/150/24795/en','TC_POPUP','width=490,height=405,screenX=300,screenY=250,top=250,left=300,scrollbars=yes,resizable=no');
【问题讨论】:
-
从 ( 到 ) 取子串会不会太容易了?
-
得到
()里面的子串,然后在,的基础上炸开,得到第一个索引值 -
哦,对不起,我没有注意到括号内有超过 1 个字符串
标签: python python-3.x beautifulsoup