昨天抽取并解析了一大批从微信钩子收取到的小程序消息,它们都是用很复杂的XML表示的。平常不是很接触XML,本文就随便说说XML的两种解析方式。 DOM解析方式 DOM即文档对象模型(document object model)。根据W3C的描述,DOM是一套用于HTML和XML文档的标准接口,它定义了文档的逻辑结构,以及访问或操作文档的方式。 DOM Parser会将文档解析为包含元素、属性和文本的树形结构(类似抽象语法树,但带有细节)。举个例子,对于如下的XML文档: en.wikipedia.org de.wikipedia.org fr.