小编典典

正则表达式中的范围用于阿拉伯字母

python

在Python中使用Regex时,使用方括号表示一系列字符很容易a-z,但这似乎不适用于其他语言,例如阿拉伯语:

import re
pattern = '[ي-ا]'
p = re.compile(pattern)

这会导致出现一个长错误报告,结尾为

raise error("bad character range")
sre_constants.error: bad character range

如何解决?


阅读 215

收藏
2020-12-20

共1个答案

小编典典

请改用Unicode转义。

>>> re.compile('[\u0627-\u064a]')
<_sre.SRE_Pattern object at 0x237f460>
2020-12-20