【发布时间】:2021-06-10 06:01:08
【问题描述】:
所以这里是一个字符串
[{'display_html': "<img src='/images/C_small.png'/> <b><a href='/u/11339405'>GDcheerios</a></b> achieved rank #936 on <a href='/b/1952051?m=0'>frederic - ONLYWONDER [Singing sometimes]</a> (osu!)", 'beatmap_id': 1952051, 'beatmapset_id': '807885', 'date': datetime.datetime(2021, 6, 1, 5, 17, 11, 80000), 'library': '', 'epic_factor': '1'}, {'display_html': "<img src='/images/A_small.png'/> <b><a href='/u/11339405'>GDcheerios</a></b> achieved rank #77 on <a href='/b/2401143?m=0'>Falcom Sound Team jdk - Desert After Tears [Inferno]</a> (osu!)", 'beatmap_id': 2401143, 'beatmapset_id': '1150262', 'date': datetime.datetime(2021, 6, 1, 4, 21, 3, 80000), 'library': '', 'epic_factor': '1'}]
我有一些正则表达式代码可以从中获取我想要的某些部分
\>(\w+)|( achieved rank .\w+ on )|m=0'>(.*? - .*?\])
问题是他们每个商店都在自己的组中。因此,当我打印 .group() 时,它只会导致
GDcheerios
而我想要的是
GDcheerios 在 frederic 上获得第 936 名 - ONLYWONDER [有时唱歌]
【问题讨论】:
-
你需要删除html标签;)
标签: python python-3.x regex