【发布时间】:2018-03-06 16:00:51
【问题描述】:
我有一个预定义的字符->类型字典。例如,'a' - 是小写字母,1 是数字,')' 是标点符号等。 使用以下脚本,我标记给定字符串中的所有字符:
labels=''
for ch in list(example):
try:
l = character_type_dict[ch]
print(l)
labels = labels+l
except KeyError:
labels = labels+'o'
print('o')
labels
例如,给定"1,234.45kg (in metric system)" 作为输入,代码将生成dpdddpddwllwpllwllllllwllllllp 作为输出。
现在,我想根据组拆分字符串。输出应该是这样的:
['1',',','234','.','45','kg',' ','(','in',' ','metric',' ','system',')']
也就是说,它应该根据字符类型的边框进行分割。 有什么想法可以有效地做到这一点吗?
【问题讨论】:
-
我认为
labels是错误的。它将k视为w和g视为l -
哦,感谢您的关注。我可能需要调试字典创建步骤。
标签: python string parsing split