小编典典

将UTF-8 Unicode字符串转换为ASCII Unicode转义的字符串

java

我需要将unicode字符串转换为具有以unicode编码的非ascii字符的字符串。例如,字符串“汉字Max”应显示为“ \ u6F22 \ u5B57
Max”。

我尝试过的

  1. 的不同组合

新的String(sourceString.getBytes(encoding1),encoding2)

  1. Apache StringEscapeUtils也会转义ascii字符,例如双引号

StringEscapeUtils.escapeJava(源代码)

有没有一种简单的方法来编码这样的字符串?理想情况下,仅应使用Java 6 SE或Apache Commons来获得所需的结果。


阅读 219

收藏
2020-10-16

共1个答案

小编典典

这是乔恩·斯凯特(Jon Skeet)在评论中想到的简单代码:

final String in = "šđčćasdf";
final StringBuilder out = new StringBuilder();
for (int i = 0; i < in.length(); i++) {
  final char ch = in.charAt(i);
  if (ch <= 127) out.append(ch);
  else out.append("\\u").append(String.format("%04x", (int)ch));
}
System.out.println(out.toString());

正如乔恩所说,代理对将被表示为一对\u逃生。

2020-10-16