爬取抖音的回复信息
由于我姐开了一个抖音,然后说信息太多回复不过来。写一个小爬虫查看一下有多少购买的需求。
手机抓包
打开Charles,手机侧配置好代理,访问抖音。
需要抓取的两个包分别为:用户首页
其中一条视频的回复信息
由于两者很相似,就讲一下回复信息的抓包
可以看到从返回值中可以看到包含了我们需要的回复信息
对这个请求进行分析:
请求方式是GET
URL是https://aweme.snssdk.com/aweme/v2/comment/list/
携带的内容是:
1 | params_message = {'version_code': '3.4.0', |
经过多个不同的视频的抓包可以看到aweme_id
是会发生变化的,所以可以猜测它为视频的标识符。
编写函数
使用requests就可以快速的进行get请求
过滤消息
首先拿到client_items的内容并判断是否为一个列表
然后使用正则去检索消息中包含买|多少|钱|微信|卖
这些关键字的回复
再使用print
将关注的内容打印出来即可
输出结果
代码全文
1 | #!/usr/bin/env python |