本篇简单介绍 xml 在python爬虫方面的使用,想要具体学习 xml 可以到 w3school 查看 xml 文档
xml 文档链接:http://www.w3school.com.cn/xmldom/xmldom_reference.asp

Python爬虫教程-20-xml简介

  • XML(Extensible Markup Language) 可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
  • 用途:它被设计用来 传输存储 数据

简单的概念:

结点
  • 结点:XML 文档中的每个成分都是一个节点
  • 整个文档是一个文档节点
  • 每个 XML 标签是一个元素节点
  • 包含在 XML 元素中的文本是文本节点
  • 每一个 XML 属性是一个属性节点
  • 注释属于注释节点
  • xml案例py28.xml文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py28.xml
<?xml version="1.0" encoding="UTF-8" ?>

<booksore>
    <book category="cooking">
        <title lang="en">Everyday Italian</title>
        <auther>Gidada De</auther>
        <year>2018</year>
        <price>23</price>
    </book>

    <book category="education">
        <title lang="en">Python is Python</title>
        <auther>Food War</auther>
        <year>2008</year>
        <price>83</price>
    </book>

    <book category="sport">
        <title lang="en">Running</title>
        <auther>Klaus Kuka</auther>
        <year>2010</year>
        <price>43</price>
    </book>

</booksore>
  • 在上面的 XML 中,根节点是 。文档中的所有其他节点都被包含在
  • 根节点 有3个 节点:
  • 第一个 节点有4个节点:, <author>, <year> 以及 <price>,其中每个节点都包含一个文本节点,"Everyday Italian", "Gidada De", "2018" 以及 "23"</price></year></author>

其他就不介绍了,附上链接

XML文档

结点操作

自行查看文档就可以 http://www.w3school.com.cn/xmldom/dom_intro.asp

更多文章链接:Python 爬虫随笔


  • 本笔记不允许任何个人和组织转载
内容来源于网络如有侵权请私信删除
你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!