【发布时间】:2019-04-23 18:49:35
【问题描述】:
snapshot感谢大家的回答。这是有效的exp twt_clean.text.str.extract('((.(?=\d+)[0-9]*.[0-9]+|[0-9]+)/([1-9][0-9 ]+))')
输出:
12/10 486
10/10 436
11/10 413
13/10 287
9/10 153
8/10 98
7/10 51
14/10 38
5/10 33
6/10 32
3/10 19
4/10 15
2/10 9
1/10 4
204/170 1
80/80 1
9/11 1
11.26/10 1
88/80 1
50/50 1
4/20 1
7/11 1
144/120 1
44/40 1
420/10 1
0/10 1
45/50 1
84/70 1
1776/10 1
13.5/10 1
165/150 1
99/90 1
60/50 1
121/110 1
11.27/10 1
9.75/10 1
Name: ratings, dtype: int64
但是现在,上述 exp 的结果在几行中获取前导空格,这些空格不是整数而是浮点数。上面的 exp 本身如何消除前导空格。请帮忙。
【问题讨论】:
-
((\d+\.\d+|\d+)/([1-9]\d+))regex101.com/r/l6Kapl/1 -
尝试匹配空格或制表符,然后使用捕获组
[ \t]*(\d+(?:\.\d+)?/[1-9]\d+)regex101.com/r/e1nqEa/1 -
@Pauline 我的回答有帮助吗?
-
([0-9]+(?:\.[0-9]+)?)/([1-9][0-9]+)工作吗?
标签: regex