我需要将unicode字符串转换为具有以unicode编码的非ascii字符的字符串。例如,字符串“汉字Max”应显示为“ \ u6F22 \ u5B57 Max”。
我尝试过的
新的String(sourceString.getBytes(encoding1),encoding2)
StringEscapeUtils.escapeJava(源代码)
有没有一种简单的方法来编码这样的字符串?理想情况下,仅应使用Java 6 SE或Apache Commons来获得所需的结果。
这是乔恩·斯凯特(Jon Skeet)在评论中想到的简单代码:
final String in = "šđčćasdf"; final StringBuilder out = new StringBuilder(); for (int i = 0; i < in.length(); i++) { final char ch = in.charAt(i); if (ch <= 127) out.append(ch); else out.append("\\u").append(String.format("%04x", (int)ch)); } System.out.println(out.toString());
正如乔恩所说,代理对将被表示为一对\u逃生。
\u