【发布时间】:2019-12-17 21:46:50
【问题描述】:
我希望做与这里所做的相反的事情:
import re
text = '1234-5678-9101-1213 1415-1617-1819-hello'
re.sub(r"(\d{4}-){3}(?=\d{4})", "XXXX-XXXX-XXXX-", text)
output = 'XXXX-XXXX-XXXX-1213 1415-1617-1819-hello'
Partial replacement with re.sub()
我的总体目标是使用神经网络替换文本中的所有XXXX。 XXXX 可以表示 .csv 文件中的名称、地点、数字、日期等。
最终结果如下:
XXXX went to XXXX XXXXXX
海绵宝宝去了迪斯尼乐园。
简而言之,我正在取消屏蔽文本并将其替换为使用模糊生成的数据集。
【问题讨论】:
标签: python-3.x nlp lstm