【发布时间】:2017-03-25 08:18:32
【问题描述】:
在“窄”Python 中构建 we should 使用特殊的正则表达式模式来匹配代理对的范围。这种模式可能相当复杂:
# Pattern we want:
pattern = '[\U000105c0-\U0001cb40]'
# Pattern we should use in "narrow" build:
pattern = '(?:\uD801[\uDDC0-\uDFFF]|[\uD802-\uD831][\uDC00-\uDFFF]|\uD832[\uDC00-\uDF40])'
但是如何为给定的任意代理范围创建一个(例如\U000105c0-\U0001cb40)?
创建这种模式的算法是什么?
在 Python 中是否有任何现成的解决方案?
【问题讨论】:
-
您的意思是要动态替换此类模式(即使是较长的模式)?
-
@WiktorStribiżew 假设为两个给定字符生成:
get_pattern('\U000105c0', '\U0001cb40')