在正则表达式中匹配非 ASCII 字符的最简单方法是什么?我想单独匹配输入字符串中的所有单词,但语言可能不是英语,所以我需要匹配像眉、枚、脽和帽这样的东西。此外,这是在 Javascript/jQuery 中,因此任何解决方案都需要适用于此。
这应该这样做:
[^\x00-\x7F]+
它匹配任何不包含在ASCII 字符集中的字符(0-127,即 0x0 到 0x7F)。
你可以用 Unicode 做同样的事情:
[^\u0000-\u007F]+
对于 unicode,您可以查看以下 2 个资源: