【发布时间】:2017-10-11 20:00:23
【问题描述】:
我有一个使用 BeautifulSoup 进行抓取的 python 脚本。这是我的代码:
re.findall('stream:\/\/.+', link)
旨在查找以下链接:
stream://987cds9c8ujru56236te2ys28u99u2s
但它也返回这样的字符串:
stream://987cds9c8ujru56236te2ys28u99u2s [SD] Spanish - (9.15am)
即有我不想要的空格和额外的东西。我该如何表达
re.findall
所以它只返回链接的第一部分?
(提前致谢)
【问题讨论】:
-
$是字符串结尾的正则表达式
标签: python beautifulsoup findall scraper