为什么以下显示在Linux和Windows中有所不同?
System.out.println(new String("¿".getBytes("UTF-8"), "UTF-8"));
在Windows中:
¿
在Linux中:
一个
System.out.println()以系统默认编码输出文本,但是控制台根据其自身的编码(或“代码页”)设置解释该输出。在Windows机器上,这两种编码似乎匹配,但是在Linux机器上,输出显然是以UTF-8格式输出的,而控制台将其解码为ISO-8859-1之类的单字节编码。或者,如Jon所建议的那样,源文件被保存为UTF-8并javac正在以其他方式读取它,可以通过使用Unicode转义来避免此问题。
javac
当您需要输出除ASCII文本以外的任何内容时,最好的选择是使用适当的编码将其写入文件,然后使用文本编辑器读取文件- 控制台过于受限且过于依赖系统。顺便说一下,这段代码:
new String("¿".getBytes("UTF-8"), "UTF-8")
…对输出没有影响。所做的全部工作就是将字符串的内容编码为字节数组,然后再次对其进行解码,从而再现原始字符串,这是一种昂贵的无操作操作。如果要以特定编码输出文本,则需要使用OutputStreamWriter,如下所示:
FileOutputStream fos = new FileOutputStream("out.txt"); OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");