Python,爬虫与深度学习(3)——番外篇(一)HTML格式与python解析HTML
步骤/目录:
1.HTML简介
2.HTML的一般格式
3.HTML的各种标签
(0)常见的属性
(1)标题与段落
(2)文本格式
(3)网页与图像
(4)头部
(5)表格及列表
(6)区块元素
(7)表单与输入
(8)脚本
(9)iframe框架
4.python解析HTML
(1)bs4库
a.找到单个标签
b.找到多个标签
c.其他find系列的方法
d.标签的层级关系
e.取得标签的内容
f.取得标签的属性值
g.取得标签名
h.格式化输出
(2)正则表达式
(3)XPath
a.XPath的基础操作
b.XPath的谓语
c.XPath的通配符
d.XPath的逻辑符号
e.XPath的函数
f.XPath的轴
g.python使用XPath
(4)其他