【问题标题】:re.search returning empty tuplere.search 返回空元组
【发布时间】:2026-01-17 22:10:01
【问题描述】:
f=open("galcode.txt")
for element in f:
 galcode_scan = re.search(ur'http://i\.imgur\.com/\w{5,8}', element)
 if galcode_scan:
    print galcode_scan.groups()
f.close()  

本例中的 Galcode.txt 是 imgur 上画廊的 html。我正在尝试获取发布到 imgur 的画廊的所有链接的列表。如果我在输入画廊名称并收到 galcode 后运行它,我得到的只是大约 15 ()。如何获取链接列表?

谢谢

【问题讨论】:

    标签: python regex imgur capture-group


    【解决方案1】:

    您没有任何捕获组,因此.groups() 返回一个空元组。请改用.group() 或用括号括住您的正则表达式 (ur'(http://i\.imgur\.com/\w{5,8})')。

    也就是说,我强烈建议使用 BeautifulSoup、cssselect 或任何其他 HTML 解析库。

    【讨论】:

      【解决方案2】:

      最简单的方法是使用 HTML 解析器,例如 Beaufitul Soup。它适用于 Python 2.7 和 3。

      【讨论】: