我在Python中有一个Unicode字符串,我想删除所有的重音符号(变音符号)。
我在网上发现了一种优雅的方法(使用Java):
重要说明:我想避免使用带有重音符号到非重音符号的显式映射的代码。
Unidecode是正确的答案。它将所有unicode字符串音译为ASCII文本中最接近的可能表示形式。
例:
accented_string = u'Málaga' # accented_string is of type 'unicode' import unidecode unaccented_string = unidecode.unidecode(accented_string) # unaccented_string contains 'Malaga'and is of type 'str'