小编典典

为什么即使使用UTF-8,在Windows和Linux中¿的显示也不同?

java

为什么以下显示在Linux和Windows中有所不同?

System.out.println(new String("¿".getBytes("UTF-8"), "UTF-8"));

在Windows中:

¿

在Linux中:

一个


阅读 211

收藏
2020-11-23

共1个答案

小编典典

System.out.println()以系统默认编码输出文本,但是控制台根据其自身的编码(或“代码页”)设置解释该输出。在Windows机器上,这两种编码似乎匹配,但是在Linux机器上,输出显然是以UTF-8格式输出的,而控制台将其解码为ISO-8859-1之类的单字节编码。或者,如Jon所建议的那样,源文件被保存为UTF-8并javac正在以其他方式读取它,可以通过使用Unicode转义来避免此问题。

当您需要输出除ASCII文本以外的任何内容时,最好的选择是使用适当的编码将其写入文件,然后使用文本编辑器读取文件-
控制台过于受限且过于依赖系统。顺便说一下,这段代码:

new String("¿".getBytes("UTF-8"), "UTF-8")

…对输出没有影响。所做的全部工作就是将字符串的内容编码为字节数组,然后再次对其进行解码,从而再现原始字符串,这是一种昂贵的无操作操作。如果要以特定编码输出文本,则需要使用OutputStreamWriter,如下所示:

FileOutputStream fos = new FileOutputStream("out.txt");
OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");
2020-11-23