我正在使用java / jsp / tomcat / mysql开发一个简单的Web应用程序,最大的问题在于字符编码,因为我需要处理UTF-8编码而不是默认的8851。
首先,我想描述一下我的程序结构。我正在使用一个称为Controller.java的Servlet来处理所有请求。因此,在web.xml中,我有一个Controller Servlet,它可以处理来自* .do的所有请求。
然后,该Controller将基于请求的URL调度请求,例如,如果客户端请求register.do,则Controller会将请求调度到Register.java。
在Register.java中,有一个方法以请求为参数,即:
public String perform(HttpServletRequest request) { do something with the request... }
所以问题是,如果我想在此方法内以UTF-8打印某些内容,它将给出随机字符。例如,我有一个存储多个常量的Enum,Enum具有的属性之一就是其繁体中文名称。如果我打印
public static void main(Stirng[] args{ System.out.println(MyEnum.One.getChn()); logger.info(MyEnum.One.getChn()); }
这是正确的中文印刷。但是,如果我将确切的代码放入处理HttpServletRequest的方法中:
public String perform(HttpServletRequest request) { System.out.println(MyEnum.One.getChn()); logger.info(MyEnum.One.getChn()); }
它们以随机字符的形式打印,但是我可以从调试窗口(eclipse)中看到,变量中包含正确的中文字符。
因此,当我想存储request.getParameter()中的值时,也会发生相同的情况。在调试窗口中,我可以看到该变量包含正确的字符,但是我将其打印出来或尝试将其存储在数据库中,这是随机字符。
我不知道为什么这种行为会如此,这使我无法读取提交的表单值并将其存储到数据库中。有人可以对此提供一些提示吗?
十分感谢。
如果您需要使用UTF-8编码(的确,这几天每个人都应该这样做),则可以遵循Tomcat FAQ中的“ UTF-8 Anywhere HOWTO”:
http://wiki.apache.org/tomcat/FAQ/CharacterEncoding#Q8
请记住,您还需要在数据库的文本字段中支持UTF-8。
还请记住,有时“打印”其中包含非ASCII字符的字符串到日志文件或控制台中可能会受到以下影响:
您最好将这些值写入文件,然后使用十六进制编辑器检查内容,以确保获得所需的字节值。