我想删除特殊字符,例如:
- + ^ . : ,
使用Java从String中获取。
这取决于你定义为特殊字符的内容,但是请尝试replaceAll(...):
replaceAll(...)
String result = yourString.replaceAll("[-+.^:,]","");
请注意,该^字符不能是列表中的第一个字符,因为你要么必须对其进行转义,否则将意味着“除这些字符外的任何字符”。
另一个注意事项:-字符必须是列表中的第一个或最后一个,否则你必须对其进行转义,否则它将定义一个范围(例如:-,,表示“ :to 范围内的所有字符” ,)。
:-,
:to
,
所以,为了保持一致性,而不是依赖于角色定位,你可能想逃避所有那些在正则表达式特殊含义的字符(下面的列表并不完整,所以要注意的其他人物像(,{,$等等) :
(,{,$
String result = yourString.replaceAll("[\\-\\+\\.\\^:,]","");
如果要摆脱所有标点和符号,请尝试使用此正则表达式:(\p{P}\p{S}请注意,在Java字符串中,你必须转义反斜杠:)"\\p{P}\\p{S}"。
\p{P}\p{S}
"\\p{P}\\p{S}"
如果可以精确定义字符串中应保留的内容,则第三种方法可能是这样的:
String result = yourString.replaceAll("[^\\w\\s]","");
这意味着:替换所有不是单词字符(在任何情况下均为az,0-9或_)或空格的内容。
编辑:请注意,还有其他两种模式可能会有所帮助。但是,我无法全部解释它们,因此请查看regular-expressions.info的参考部分。
如Ray所建议的,这是“定义允许的字符”方法的限制性较小的替代方法:
String result = yourString.replaceAll("[^\\p{L}\\p{Z}]","");
正则表达式匹配所有不是任何语言的字母和分隔符(空格,换行符等)的所有内容。请注意,你不能使用[\P{L}\P{Z}](大写P表示不具有该属性),因为那意味着“不是字母或不是空格的所有内容”,几乎所有内容都匹配,因为字母不是空格,反之亦然。
[\P{L}\P{Z}]
有关Unicode的其他信息
某些unicode字符似乎由于不同的编码方式(例如单个代码点或代码点组合)而引起问题。有关更多信息