结构化标记处理工具¶
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html— 超文本标记语言支持html.parser— 简单的 HTML 和 XHTML 解析器html.entities— HTML 一般实体的定义- XML处理模块
xml.etree.ElementTree— ElementTree XML APIxml.dom— 文档对象模型 APIxml.dom.minidom— 最小化的 DOM 实现xml.dom.pulldom— 支持构建部分 DOM 树xml.sax— 支持 SAX2 解析器xml.sax.handler— SAX 处理句柄的基类xml.sax.saxutils— SAX 工具集xml.sax.xmlreader— 用于 XML 解析器的接口xml.parsers.expat— 使用 Expat 的快速 XML 解析