为什么即使使用UTF-8，在Windows和Linux中¿的显示也不同？

小编典典

为什么即使使用UTF-8，在Windows和Linux中¿的显示也不同？

java

为什么以下显示在Linux和Windows中有所不同？

System.out.println(new String("¿".getBytes("UTF-8"), "UTF-8"));

在Windows中：

在Linux中：

一个

阅读 211

2020-11-23

共1个答案

小编典典

System.out.println（）以系统默认编码输出文本，但是控制台根据其自身的编码（或“代码页”）设置解释该输出。在Windows机器上，这两种编码似乎匹配，但是在Linux机器上，输出显然是以UTF-8格式输出的，而控制台将其解码为ISO-8859-1之类的单字节编码。或者，如Jon所建议的那样，源文件被保存为UTF-8并javac正在以其他方式读取它，可以通过使用Unicode转义来避免此问题。

当您需要输出除ASCII文本以外的任何内容时，最好的选择是使用适当的编码将其写入文件，然后使用文本编辑器读取文件-
控制台过于受限且过于依赖系统。顺便说一下，这段代码：

new String("¿".getBytes("UTF-8"), "UTF-8")

…对输出没有影响。所做的全部工作就是将字符串的内容编码为字节数组，然后再次对其进行解码，从而再现原始字符串，这是一种昂贵的无操作操作。如果要以特定编码输出文本，则需要使用OutputStreamWriter，如下所示：

FileOutputStream fos = new FileOutputStream("out.txt");
OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");

2020-11-23