【发布时间】:2016-12-09 18:48:38
【问题描述】:
我需要一个 Python 正则表达式来为我提供 ~ 和 ^ 之间的所有字符串,如下所示:
~~~~ AAA ^ BBB ^ CCC > DDD ^
我试过了:
import re
target = ' ~~~~ AAA > ^ BBB ^ CCC > DDD ^ '
matchObj = re.findall(r'~(.*?)\^', target)
print matchObj
但结果是:
['~~~ ABC ']
我的期望是:
['AAA', 'BBB', 'CCC', 'DDD']
或
['^AAA', '^BBB', '^CCC', 'DDD']
我想这样做是因为我试图从这样的 HTML 页面中提取文本:
<td class="cell-1">
<div><span class="value-frame"> ~~~~ ABC ^ DEF ^ HGK > LMN ^</span></div>
</td>
【问题讨论】:
-
为什么你还有
>作为分隔符?
标签: python regex beautifulsoup