Tomcat的中文处理(二)

类别:Java 点击:0 评论:0 推荐:

Tomcat的中文處理(二):

 

上篇我们介绍了tomcat是怎么对接收到字符进行编码的,现在我们来看当向客户端写html文档的时候到底发生了什么?

 

tomcate在向客户端写出数据的時候,使用的是response的输出流來实现的。但是jsp是怎樣使用response的流的呢?

在使用JSP内含對象out輸出的時候,out是一個JspWriter实现类的对象实例,JspWriterImpl(ServletResponse response, int sz, boolean autoFlush)是一个该类的构造函数,其使用到了response,在JspWriterImpl内部还有一个java.io.Writer对象实例的引用,在使用JspWriter(JSP的out对象)写出数据的时候,会调用如下的函数来初始化

protected void initOut() throws IOException

    {

        if(out == null)

        {

            out = response.getWriter();/////////初始化 java.io.Writer對象

        }

    }来初始化该内部对象的。

然后在jspWriter的各个输出数据的函数的实现中就是調用上面的java.io.Writer對象的方法的。

    所以不论是jsp或者是servlet,对客户端写出html的時候,都是通过response.getWriter();来得到的字符流或者由getOutputStream()得到2进制流的。

   一個response存在一個字符流,也存在一個2進制流,但是在同一時刻只能打開使用一個流的。至於兩者的關係,我們在後面介紹。Jsp的out對象就是response的字符流的。

  同樣的request也存在一個字符流和一個2進制流,但是在同一時刻只能打開使用一個流的。

response的两个流的关系

    我们来考察response的实现类的getOutputStream()和getWriter函数的实现:

public ServletOutputStream getOutputStream()        throws IOException

    {

      。。。。。。。。。。。。。。。。。。。。。

            stream = createOutputStream();///创建response的2进制的输出流

   。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

        return stream;

    }

public PrintWriter getWriter()        throws IOException

 {

     。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

           ResponseStream newStream = (ResponseStream)createOutputStream();////////创建2进制流

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

            OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());

            writer = new ResponseWriter(osr, newStream);///得到response的字符输出流

 。。。。。。。。。。。。。。。。。。。。。。。。。。

        }

    }

显然,我们的字符流就是从2进制流转化而来的

    还有两个函数要注意:

public String getCharacterEncoding()//////response的编码,默认是ISO-8859-1的

    {

        if(encoding == null)//////////////////////////////////如果没有指定编码

        {

            return "ISO-8859-1";

        } else

        {

            return encoding;

        }

    }

public void setContentType(String type);设置response的类型和编码

    {

      。。。。。。。。。。。。。

            encoding = RequestUtil.parseCharacterEncoding(type);////////得到指定的编码

            if(encoding == null)

            {

                encoding = "ISO-8859-1";//////////////////////////如果沒有指定编码方式

            }

        } else

        if(encoding != null)

        {

            contentType = type + ";charset=" + encoding;

        }

    }

好了,现在我们知道了在写出字符的时候使用的response的字符流(不管是jsp或者servlet),也就是使用的OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());

注意的是newStream是response的2进制流的实现。

所以我们还得看看OutputStreamWriter的实现:

考察OutputStreamWriter的源代碼,他有一個StreamEncoder 类型的对象,就是依靠他來转换编码的;

StreamEncoder是由sun公司提供的,它有一个

public static StreamEncoder forOutputStreamWriter(OutputStream outputstream, Object obj, String s)來得到StreamEncoder对象实例。

对于jsp,servlet来说在构造他的时候 outputstream参数是response的2进制流,obj是OutputStreamWriter对象,s就是编码方式的名字。其实得到是一個StreamEncoder的子类的对象实例,

     return new CharsetSE(outputstream, obj, Charset.forName(s1)); CharsetSE是StreamEncoder的子类。

他有一个如下的函数来实现编码转换的:

void implWrite(char ac[], int i, int j)throws IOException /////// ac是要輸出String的char數組

 {

          CharBuffer charbuffer = CharBuffer.wrap(ac, i, j);

          。。。。。。。。。。。。。。。。。。。。。。。

          CoderResult coderresult = encoder.encode(charbuffer, bb, false);/////bb是ByteBuffer,存放编码后的byte缓冲区

      。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

writeBytes();///////////////////////////////將bb转化到byte数组写入到response的2进制流中

      。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

 }

 

至此,我们了解了tomcat背后的编码转换过程

 

 

本文地址:http://com.8s8s.com/it/it17968.htm