解决在tomcat5。0下编写web应用的中文问题

类别:Java 点击:0 评论:0 推荐:


解决在
tomcat50下编写web应用的


中文问题

 

一、                 JSP页面乱码(中文显示为问号)

  现象:JSP页面生成的中文数据在浏览器端显示为乱码,但是静态HTML代码中文则显示正常。

 

原因:TOMCAT5。0中JSP页面的默认编码方式是ISO-8859-1,在动态生成的HTML代码时按照ISO-8859-1(西欧字符)编码,所以显示中文时全部为问号。

 

解决方法:在所有的JSP页面里加上

   <%@ PAGE CONTENTTYPE=”TEXT/HTML;CHARSET=GB2312”>

TOMCAT5.0在解析JSP页面的时会将编码方式改为GB2312,这时中文显示正常。

 

 

二、                 INCLUDE进来的JSP页面的中文乱码

     

        现象:外层JSP页面的中文显示正常,但INCLUDE进来的JSP页面(内层页面)的中文显示乱码。

       

        原因:在外层的JSP页面中用上面<一>中的方法处理之后,外层的JSP页面正确的按照GB2312的编码方法解析,但内层(即INCLUDE进来的JSP叶面)还是按照TOMCAT的默认编码方式ISO-8859-1方式编码,所以造成内层页面的中文显示不正常。

 

解决方式:同上,在所有的内层JSP页面里加上

   <%@ PAGE CONTENTTYPE=”TEXT/HTML;CHARSET=GB2312”>,中文显示即可恢复正常。

 

注:同一个JSP页面中不能出现两个

            <%@ PAGE CONTENTTYPE=”TEXT/HTML;CHARSET=GB2312”>

 

 

 

三、                 用POST方式提交的表单数据中的中文乱码

             

        现象:用POST方式提交的表单数据出现乱码。

      原因:Tomcat在接收到请求后,并没有能够根据request中的信息设置正确的编码方式,而是采用默认编码方式ISO-8859-1编码,所以提交的表单中文数据全部为问号。

      解决:可以添加一个设置字符集的过滤器,将request中的编码方式改为GB2312,TOMCAT就

能正确的将POST方式提交的数据编码。过滤器的内容如下:

package filters;

import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;

public class SetCharacterEncodingFilter implements Filter {
 protected String encoding = null;
 protected FilterConfig filterConfig = null;
 protected boolean ignore = true;

 public void destroy() {
  this.encoding = null;
  this.filterConfig = null;
 }

public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {

 // 设置正确的编码方式
 if (ignore || (request.getCharacterEncoding() == null)) {
  String encoding = selectEncoding(request);
  if (encoding != null)
   request.setCharacterEncoding(encoding);
 }

 // 传递到下一层过滤器
 chain.doFilter(request, response);

}

public void init(FilterConfig filterConfig) throws ServletException {

 this.filterConfig = filterConfig;
 this.encoding = filterConfig.getInitParameter("encoding");
 String value = filterConfig.getInitParameter("ignore");
 if (value == null)
  this.ignore = true;
 else if (value.equalsIgnoreCase("true"))
  this.ignore = true;
 else if (value.equalsIgnoreCase("yes"))
  this.ignore = true;
 else
  this.ignore = false;

}

protected String selectEncoding(ServletRequest request) {
 return (this.encoding);
}

}


  编好了过滤器之后,还要在TOMCAT中配置过滤器。

    打开WEB-INF目录下的web.xml文件,添加下面的内容:

<filter>
 <filter-name>Set Character Encoding</filter-name>
 <filter-class>filters.SetCharacterEncodingFilter</filter-class>
 <init-param>
  <param-name>encoding</param-name>
  <param-value>GB2312</param-value>
 </init-param>
</filter>

<filter-mapping>
 <filter-name>Set Character Encoding</filter-name>
 <url-pattern>/*</url-pattern>
</filter-mapping>

 

 

四、                 在JAVASERVLET中输出的中文乱码

 

 

现象:在JAVASERVLET中用PRINTWRITER输出的中文乱码.,浏览器接收的HTML数据的编码方式为ISO-8859-1(西欧字符),这时如果在浏览器端手动的将页面的编码方式改为GB2312或GBK则页面的中文显示正常。

 

 

 原因:TOMCAT5。0页面的默认编码方式是ISO-8859-1,浏览器在收到由JSP页面生成的HTML数据时也会将HTML的数据的编码方式设为ISO-8859-1,所以造成页面上的中文字符显示为乱码。

 

 

         解决方法:

 

如下面这段代码:

 

  PrintWriter out   = response.getWriter();

  out.println("<html>");

  out.println("<head>");

  out.println("</head>");

  out.write(“错误!可能是由于信息已过期!!”);

          out.println("</html>");

         首先输出是要将response reset,这个我也不知道什么原因,reset后在按照下面的方式处理。

         然后要告诉浏览器该页面要以什么方式编码,添加。

                                                response.setContentType("text/html;charset=GB2312");

 

告诉浏览器HTML数据的编码是GB2312,再将输出的每一句中文改为以ISO-8859-1编码方式编码,改完后整个代码如下:

            response.reset();

            response.setContentType("text/html;charset=GB2312");

            out.println("<html>");

            out.println("<head>");

            out.println("</head>");

            out.write(new String("错误!可能是由于信息已过期!!".getBytes(),"ISO-8859-1"));

out.println("</html>");

 

这时输出的中文就能正确的显示了。

 

 

五.                 在资源文件中的中文数据输出到JSP页面上为乱码

  

 现象:用<BEAN:WRITE>标签在JSP页面上输出预先已编入资源文件的中文信息时显示为乱码。

 

         原因:编入资源文件的信息如果不是西欧字符就必须用NATIVE2ASCII工具将其编码方式改为ASCII编码方式。

        

         解决方法:NATIVE2ASCII是JDK自带的工具,在   你的JDK目录/BIN  目录下。其使用方法如下

               

APP.RES 是正常的可看的中文资源文件

                APPLICATIONRESOURCES.PROPERTIES要生成的能正常显示的资源文件

               

                NATIVE2ASCII APP.RES APPLICATIONRESOURCES.PROPERTIES

        

         转换完毕后,使用<BEAN:WRITE>标签输出的中文信息就能正确的显示了。

  

本文地址:http://com.8s8s.com/it/it12136.htm