如何从字符串中删除重音字符?特别是在 IE6 中,我有这样的事情:
accentsTidy = function(s){ var r=s.toLowerCase(); r = r.replace(new RegExp(/\s/g),""); r = r.replace(new RegExp(/[àáâãäå]/g),"a"); r = r.replace(new RegExp(/æ/g),"ae"); r = r.replace(new RegExp(/ç/g),"c"); r = r.replace(new RegExp(/[èéêë]/g),"e"); r = r.replace(new RegExp(/[ìíîï]/g),"i"); r = r.replace(new RegExp(/ñ/g),"n"); r = r.replace(new RegExp(/[òóôõö]/g),"o"); r = r.replace(new RegExp(/œ/g),"oe"); r = r.replace(new RegExp(/[ùúûü]/g),"u"); r = r.replace(new RegExp(/[ýÿ]/g),"y"); r = r.replace(new RegExp(/\W/g),""); return r; };
但是 IE6 让我很恼火,似乎它不喜欢我的正则表达式。
使用 ES2015/ES6 String.prototype.normalize(),
const str = "Crème Brulée" str.normalize("NFD").replace(/[\u0300-\u036f]/g, "") > "Creme Brulee"
这里发生了两件事:
normalize()
NFD
è
Crème
e
̀
自 2021 年起,还可以使用Unicode 属性转义:
str.normalize("NFD").replace(/\p{Diacritic}/gu, "")
有关性能测试,请参阅评论。
或者,如果您只想排序
Intl.Collator目前有足够的支持~95% ,这里也有一个polyfill,但我还没有测试过。
const c = new Intl.Collator(); ["creme brulee", "crème brulée", "crame brulai", "crome brouillé", "creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare) ["crame brulai", "creme brulay", "creme bruléa", "creme brulee", "crème brulée", "creme brulfé", "crome brouillé"] ["creme brulee", "crème brulée", "crame brulai", "crome brouillé"].sort((a,b) => a>b) ["crame brulai", "creme brulee", "crome brouillé", "crème brulée"]