实战1:知乎破解加密算法模拟登陆 1.1 目标站点网址 https://www.zhihu.com/signin?next=%2F 知乎上所有的数据都是得登录之后才能获取的,所以我们首先得用爬虫模拟知乎的登录操作 1.2 站点分析 1.2.1 登录过程分析 首先我们访问登录页面的时候,服务器会给我们返回一系列的cookie 这些cookie我们需要保存下来 接着,咱点击密码登录会发… 爬虫,第八章:爬虫实战 1258 字 | 5 分钟
实战2:红薯小说网爬取 红薯小说网加密破解 1.1 目标站点网址 https://www.hongshu.com/content/3052/3317-98805.html 以某篇具体文章为例,咱来破解这个网站的加密,爬取到所有的小说内容 1.2 站点分析 1.2.1 目标资源分析 我们的目的是要小说内容,那么先来看一看直接请求https://www.hongshu.com… 爬虫,第八章:爬虫实战 1197 字 | 5 分钟