在Python中使用Regex时,使用方括号表示一系列字符很容易a-z,但这似乎不适用于其他语言,例如阿拉伯语:
a-z
import re pattern = '[ي-ا]' p = re.compile(pattern)
这会导致出现一个长错误报告,结尾为
raise error("bad character range") sre_constants.error: bad character range
如何解决?
请改用Unicode转义。
>>> re.compile('[\u0627-\u064a]') <_sre.SRE_Pattern object at 0x237f460>