分类: 第八章:爬虫实战

2 篇文章

实战1:知乎破解加密算法模拟登陆
1.1 目标站点网址 https://www.zhihu.com/signin?next=%2F 知乎上所有的数据都是得登录之后才能获取的,所以我们首先得用爬虫模拟知乎的登录操作 1.2 站点分析 1.2.1 登录过程分析 首先我们访问登录页面的时候,服务器会给我们返回一系列的cookie 这些cookie我们需要保存下来 接着,咱点击密码登录会发…
实战2:红薯小说网爬取
红薯小说网加密破解 1.1 目标站点网址 https://www.hongshu.com/content/3052/3317-98805.html 以某篇具体文章为例,咱来破解这个网站的加密,爬取到所有的小说内容 1.2 站点分析 1.2.1 目标资源分析 我们的目的是要小说内容,那么先来看一看直接请求https://www.hongshu.com…
Copyright © 2022 Egon的技术星球 egonlin.com 版权所有 帮助IT小伙伴学到真正的技术