【发布时间】:2018-05-31 11:52:21
【问题描述】:
在预处理数据时,我将获得具有不同格式的相同数字特征。 例如:
1x4 wire 1 x 4 wire
1-1/2x1 wire 1-1/2 x 1 wire
11/2x1 wire 1-1/2 x 1 wire
我需要将不同的格式标准化为一种格式。
我们认为的一种方法是删除 x、-、/ 和空格并将所有内容组合在一起。 即:
1x4 wire 1 x 4 wire 14 wire
1-1/2x1 wire 1-1/2 x 1 wire 1121 wire
11/2x1 wire 1-1/2 x 1 wire 1121 wire
谁能告诉如何在 Python 中实现上述方法?
我尝试了以下代码来匹配所需的模式:
import re
regex = re.compile('(\d+.*?)\s?')
我不知道如何将其输出用于re.sub。
【问题讨论】:
-
1.学习 Python。 2.用Python编写代码。
标签: regex python-3.x regex-group