使用DOM解析并打印XML文档

类别:Java 点击:0 评论:0 推荐:

 

 照着API文档摸索了两天,发现在DOM中,一个注释(Comment)、一个属性(attribute)、一行文本(textNode)、一个元素(Element)都是一个Node。而有子节点的Node被称为元素(Element).

因此处理XML文档最主要的就是在分辨并处理各种不同的Node.

 

Dom6.java

package doms;

import javax.xml.parsers.*; //这个包被包括在j2ee 1.4.2 API中。
import org.w3c.dom.*; //这个包被包括在j2se 1.5.0 API中。
import org.xml.sax.*; //这个包被包括在j2ee 1.5.0 API中。

public class Dom6 {
    public static void main(String[] args) {
        Dom6 d6 = new Dom6();
        System.out.println(d6.parseXML("K:/test11/xml/test.xml"));  
    }  

    private String getDocumentType(Document doc) { //获取DocumentType信息。为简单起见,不涉及对Entity等的解析。
        StringBuffer sb = new StringBuffer();
        DocumentType type = doc.getDoctype();
        String name = type.getName();
        String publicId = type.getPublicId();
        String systemId = type.getSystemId();
        if (name == null) return "";
       
        sb.append("<!DOCTYPE " + name);
        sb.append(publicId == null ? "" : " PUBLIC \"" + publicId + "\"");
        sb.append(systemId == null ? "" : " \"" + systemId + "\"");
        sb.append(">\n");
        return sb.toString();
    }
    private String getElementAttrs(Node node) { //获取一个Element的所有Attribute。
        StringBuffer attrs = new StringBuffer();
        if (node.hasChildNodes()) {
            NamedNodeMap map = node.getAttributes();
            for (int i = 0; i < map.getLength(); i++) {
                Node attr = map.item(i);
                attrs.append(" " + attr.getNodeName() + "=\"" + attr.getNodeValue() + "\"");   
            }  
        } 
        return attrs.toString();
    }
    private String getXMLHeader(Document doc) { //获取XML头定义。
        StringBuffer header = new StringBuffer();
        String encoding = doc.getXmlEncoding();
        String version = doc.getXmlVersion();
        boolean standalone = doc.getXmlStandalone();
        if (version == null || encoding == null) return ""; //如果没有定义XML头,则返回空串。
        header.append("<?xml");
        header.append(" version=\"" + version + "\"");
        header.append(" encoding=\"" + encoding + "\"");
        header.append(standalone == false ? "" : " standalone=\"true\"");
        header.append("?>\n");
        return header.toString();
    }
    private StringBuffer circle(NodeList list, StringBuffer sb) { //递归调用,获取所有Element和Node。
        for (int i = 0; i < list.getLength(); i++) {
            Node node = list.item(i);
            if (node.hasChildNodes()) { //如果该节点含有子节点,表明它是一个Element。
                String nodeName = node.getNodeName();
                sb.append("<" + nodeName + this.getElementAttrs(node) + ">"); //获取该Element的所有Attribute。
                sb = this.circle(node.getChildNodes(), sb); //递归调用,操作该Element的子节点。
                sb.append("</" + nodeName + ">");
            } else if (node.getNodeType() == Node.COMMENT_NODE) { //检查这个非Element节点是否是注释。
                sb.append("<!--" + node.getNodeValue() + "-->");
            } else {
                sb.append(node.getNodeValue()); 
            }
        }  
        return sb;
    }
    private String parseXML(String xmlFile) { //解析一个XML文档。
        StringBuffer sb = new StringBuffer("///////// ParseXML //////////\n");
        try {
            javax.xml.parsers.DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            javax.xml.parsers.DocumentBuilder builder = factory.newDocumentBuilder();
            org.w3c.dom.Document doc = builder.parse(xmlFile); //获取XML文档.
           
            sb.append(this.getXMLHeader(doc)); //获取XML头定义。

            sb.append(this.getDocumentType(doc)); //获取DocumentType信息。
            
            org.w3c.dom.Element rootElement = doc.getDocumentElement(); //获取根元素。
            String rootTagName = rootElement.getTagName();
            sb.append("<" + rootTagName + this.getElementAttrs(rootElement) + ">");
            if (rootElement.hasChildNodes()) { //一般来说,根元素肯定存在子节点。
                sb = this.circle(rootElement.getChildNodes(), sb); //递归调用,操作根元素的子节点。  
            }
            sb.append("</" + rootTagName + ">");
        } catch (javax.xml.parsers.ParserConfigurationException pce) {
           
        } catch (org.xml.sax.SAXException se) {
           
        } catch (java.io.IOException ioe) {
           
        }
        return sb.toString();  
    }
}

 

 

K:/test11/xml/test.xml

<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">

<web-app>
    <!-- Display Name Field -->
    <display-name>adfadfadsdsafsda</display-name>
    <!-- Servlet Defination -->
    <servlet>
        <servlet-name>Dom1</servlet-name>
        <servlet-class>doms.Dom1</servlet-class>
        <init-param>
            <param-name>name</param-name>
            <param-value>bitan</param-value>
        </init-param>
    </servlet>
    <!-- Listener List -->
    <listener>
        <listener-class>doms.ListenerClass</listener-class>
    </listener>
    <!-- Tag Library Mapping -->
    <taglib>
        <taglib-uri>tag1.tld</taglib-uri>
        <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>
    </taglib>
   
    <!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->
    <myself-tag author="bitan" email="[email protected]">
        下面是一些信息:
        <test-time>2005年1月14日</test-time>
        <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>
        <text-editer>UltraEdit-32</text-editer>
        测试结束。
    </myself-tag>
</web-app>

 

 

结果:

 



K:\test11>javac -classpath %classpath% -d .\web-inf\classes .\src\Dom6.java

K:\test11>java -classpath .\web-inf\classes doms.Dom6
///////// ParseXML //////////
<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN
" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app>
    <!-- Display Name Field -->
    <display-name>adfadfadsdsafsda</display-name>
    <!-- Servlet Defination -->
    <servlet>
        <servlet-name>Dom1</servlet-name>
        <servlet-class>doms.Dom1</servlet-class>
        <init-param>
            <param-name>name</param-name>
            <param-value>bitan</param-value>
        </init-param>
    </servlet>
    <!-- Listener List -->
    <listener>
        <listener-class>doms.ListenerClass</listener-class>
    </listener>
    <!-- Tag Library Mapping -->
    <taglib>
        <taglib-uri>tag1.tld</taglib-uri>
        <taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>
    </taglib>

    <!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->
    <myself-tag author="bitan" email="[email protected]">
        下面是一些信息:
        <test-time>2005年1月14日</test-time>
        <jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>
        <text-editer>UltraEdit-32</text-editer>
        测试结束。
    </myself-tag>
</web-app>

K:\test11>

本文地址:http://com.8s8s.com/it/it11880.htm