在正则表达式中匹配非ASCII字符的最简单方法是什么?我想在输入字符串中单独匹配所有单词,但是语言可能不是英语,因此我需要匹配ü,ö,ß和ñ。另外,这是在Javascript/ jQuery中,因此任何解决方案都需要适用于此。
应该这样做:
[^\x00-\x7F]+
它匹配ASCII字符集(0-127,即0x0至0x7F)中不包含的任何字符。
您可以使用Unicode执行相同的操作:
[^\u0000-\u007F]+
对于unicode,您可以查看以下2个资源: