02-百度贴吧

百度贴吧爬虫

分析

分析流程图

分析 url 的时候我们一般都是从第二页开始分析,可以看出 url 的变化

分析结果

结果概要

请求目标

分析结果

请求方式分析

GET

请求参数分析

pn每页50发生变化,其他参数固定不变

请求头分析

只需要添加User-Agent

代码实现流程

  1. 实现面向对象构建爬虫对象

  2. 爬虫流程四步骤

    1. 获取 url 列表

    2. 发送请求获取响应

    3. 从响应中提取数据

    4. 保存数据

代码实现

详细代码请点击

Last updated

Was this helpful?