北京北大青鳥學校學術部老師表示:隨著互聯網技術的發展,XML技術變得越來越重要,從而出現了很多與XML的整合應用方面的技術,SAX就是其中之一。今天,北京北大青鳥學校的老師就和大家談談java怎樣使用sax對xml文檔的解析。
首先,北京北大青鳥學校老師先講解SAX對XML文檔的解析機制。一般情況下,SAX 處理器分析XML代碼將生成以下事件:
Start document
Start element ()
Characters (white space)
Start element ()
Characters ()
End element ()
............
End element ()
具體解析步驟如下
一、 創建事件處理程序,SAX 提供應用程序可擴展的類 DefaultHandler。
創建的解析類config必須繼承類 DefaultHandler。
如:public class Config extends DefaultHandler{}
二、使用 JAXP 來創建解析器:使用 JAXP 中的類 XMLReaderFactory 來創建解析器。首先聲明 XMLReader的一個對象 parser。然后使用
XMLReaderFactory的createXMLReader方法來創建 SAXParser。
XMLReader parser =
XMLReaderFactory.createXMLReader(
"org.apache.xerces.parsers.SAXParser");
三、一旦創建了解析器,則需要將 config 設置為內容處理程序,以便于其接收事件。
parser.setContentHandler(this);
但是,當然總會有可能在試圖進行解析時,數據有問題。這時應該創建ErrorHandler 在這樣的情況下,有一個處理程序來處理錯誤和內容。
parser.setErrorHandler(this);
四、準備對文件進行實際解析。應用程序文件傳遞給 parse(),然后應用程序會繼續運行。
parser.parse(confFile);(北京北大青鳥學校)
五、接下來就開始對文檔進行解析了。前面說過SAX的處理機制,SAX在處理XML流的過程中,首先產生startDocument()事件,實際上該事件什么也沒有發生,因為還沒有定義任何解析的事件。使用 startDocument() 事件只是為了通知文檔的開始。類似其它 SAX 事件,該事件拋出 SAXException。
例如:
public void startDocument()
throws SAXException {
System.out.println(
"Tallying survey results...");
}
六、跟下來,就正式開始對文件進行解析了。這時SAX會產生一個startElement()事件,對于每個元素,都會回送一個傳遞給 startElement() 事件的名稱。不過解析器實際所傳遞是:該元素的名稱空間信息;該元素的實際名稱或 localName;名稱空間別名和 localName 的組合(否則是限定名或 qname);以及該元素任何屬性。startElement() 事件還提供對元素屬性的訪問。將這些屬性傳遞進稱為 Attributes的數據結構。根據屬性在數組中位置或屬性的名稱,可以檢索該屬性值。
例如:
public void startElement(
String namespaceURI,
String localName,
String qName,
Attributes atts)
throws SAXException {
String s = (!"".equals(localName)) ? localName : qName;
System.out.print("Start element: ");
System.out.println(localName);
tag = s;
if (localName == "Connector") {
System.out.println("name: "
+ atts.getValue("name"));
} else if (localName == "port") {
thisQuestion = atts.getValue("servername");
}else if (localName == "maxThreadPoolSize") {
thisQuestion = atts.getValue("poolname");
}
if (localName == "Database") {
System.out.println("name: "
+ atts.getValue("name"));
} else if (localName == "driverName") {
thisQuestion = atts.getValue("dataname");
}else if (localName == "encoding") {
thisQuestion = atts.getValue("codename");
}
thisElement = localName;(北京北大青鳥學校)
for (int att = 0;att < atts.getLength(); att++) {
String attName = atts.getLocalName(att);
System.out.println(" "
+ attName + ": "
+ atts.getValue(attName));
}
}
七、有了元素,接下來用 characters() 來檢索實際的數據。這時可以使用下面的方法獲得實際的數據:可以用String s = new String(ch, start, length).trim();這個方法來獲得數據。
例如:
public void characters(char[] ch,
int start,
int length)
throws SAXException {
String s = new String(ch, start, length).trim();
if (!"".equals(s)) {
if ("port".equals(tag)) {
System.out.println(Integer.parseInt(s));
} else if ("maxThreadPoolSize".equals(tag)) {
System.out.println(Integer.parseInt(s));
}
//System.out.println(tag+" = "+s);
}
s = new String(ch, start, length).trim();
if (!"".equals(s)) {
if ("driverName".equals(tag)) {
System.out.println(s);
} else if ("encoding".equals(tag)) {
System.out.println(s);
}
//System.out.println(tag+" = "+s);
}
}
八、接下來的要做的就是用endElement()來結束對一個xml的 element的解析。
例如:下面的方法
public void endElement(String namespaceURI,
String localName,
String qName)
throws SAXException {
printIndent(indent);
System.out.println("End Element: "+localName);
indent = indent - 4;
thisQuestion = "";
thisElement = "";
九、最后就是告訴程序,xml文件解析完畢,此時,用endDocument()來結束程序。
例如:
public void endDocument() {}
北京北大青鳥學校老師總結;sax處理xml的方法還基本上是差不多的,只是一二步的方法相對多一點,那些其他的方法,如果您有疑問,歡迎來北京北大青鳥學校學習相關的課程。