本站资源限时全部免费
开启辅助访问
切换到窄版
登录
立即注册
首页
论坛
前线论坛
频道
软件
插件
Plugin
网课
搜索
搜索
每日签到
本版
文章
帖子
用户
QQ前线乐园
»
论坛
›
前线大厅
›
网络分享
›
学习 Python 爬虫,采集抖音用户信息经验分享 ...
返回列表
发新帖
学习 Python 爬虫,采集抖音用户信息经验分享
[复制链接]
460
|
0
|
2024-6-27 18:16:10
|
显示全部楼层
|
阅读模式
第一次发贴混脸熟,一前好几个号都没玩被清不仅,近来在学习python爬虫,想采集爬取抖音用户信息,由于见到相关爬虫岗位有这个需求,突发奇想,分享一下经验,顺便整理自己的思路。首先是听到b站不二小段的爬虫视频,脑子王者的外挂,通过更改fidder函数把脑子王者的json数据包保存本地,用python脚本循环读取数据包,之后手动打开浏览器搜索题目。如今我就想把这个思路扩充一下到抖音这儿来。
首先安装最新的fidder,抖音用户的数据包传输合同是https。须要下载fidder的证书,安装到手机或则安卓模拟器。我用的模拟器,之后设置安卓的模拟器的代{过}{滤}理IP设置为笔记本的IP,如今模拟器所有的网路恳求都被fidder获取了,如今我们就是要抓取数据包,剖析数据包,推荐一个剖析json包的网址,能把很复杂难懂的数据节突显的很清晰,在模拟器刷抖音的时侯json数据包,我就一个个的把它复制下来看下,网址在图片中。
接出来就想办法保存这个数据包,重点就是更改fidder函数,fidder这个工具在做爬虫和外挂的时侯常常使用,特地的学习了一下这个fidder的使用。更改fiiderscript,这个包含用户信息的json数据包的恳求网址和host都是一样的,借助这个更改的函数,把它保存到本地某个文件夹。
fidder函数的保存到本地的数据只能覆盖,不能添加,所以只能用脚本循环读取了,所以用python写个脚本吧,把读下来的数据解析一下,保存到本地数据库。
如今就差最后一步写一个模拟人工划抖音的脚本了,既然用模拟器的话,想要多开几个,数据都会保存的更快那就用最小的帧率写一个吧320*480的帧率,节省资源,抓取用户的信息要步入个人主页。思路是在抖音上面往上划,辨识是不是广告或则直播,是广告再往下话,不是点头像,延时返回,之后循环。打包成apk安装到模拟器实机测试!速率还不错。还要继续优化脚本,设置消除缓存的功能才好,缓存太多了都会很卡。
虽然抓包的过程中有很多有意思的东西,例如抓到了无水印的视频链接,可以搜集出来,哈哈。还有一些细节问题,没有写清楚,有问题不懂的可以留言我会仔细解答哈。高手勿喷
最后附件代码打包,密码为52pojie。同时上传到百度云了。
代码.rar
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
Hqiqi
1725
主题
1726
帖子
5959
积分
论坛元老
论坛元老, 积分 5959, 距离下一级还需 9994040 积分
论坛元老, 积分 5959, 距离下一级还需 9994040 积分
积分
5959
加好友
发消息
回复楼主
返回列表
QQ教程篇
网络分享
绿色软件
虚拟商品
影视资源
VIP项目
网络资源
软件下载
有奖活动
新闻资讯
图文推荐
热门排行
1
QQ 动态刷赞链接,卡盟猫官网,快手 2 元刷 100 粉的网站,你想要的都在这里
2
移动互联网时代,农资经销商为何纷纷转向微信小程序?
3
抖音推广流量入口大盘点:推荐页、关注页、同城页如何获取更多流量?
4
2024 年新人发布视频必备:一招让你的视频获得更高曝光量
5
刘思毅:偷流量已死,好内容永存!抖音、视频号限制偷流量,平台严格监管
6
房产中介店长如何利用短视频提升成交效率?
7
小红书平台 12 月-1 月变化总结:报备笔记数量锐减,品牌投放策略调整
8
中视频第二天,播放量低到让我想放弃,我该怎么办?