如何从字符串中删除变音符号?
例如,转换适用于所有语言的所有á-> a,č-> c等。
我正在进行全文搜索,因此需要忽略搜索文字的任何变音符号。
谢谢
使用9级以上的API,您可以使用Normalizer类,例如
String normalized = Normalizer.normalize("âbĉdêéè", Form.NFD) .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
(Keysers链接的答案看起来更好,它可以清除更多废话)
这将返回"abcdeee"。
"abcdeee"