熟悉我的小伙伴都了解,我之前发布过2款软件:
【GUI软件】小红书搜索结果批量采集,支持多个关键词同时抓取!
【GUI软件】小红书详情数据批量采集,含笔记内容、转评赞藏等,支持多笔记同时采集!
现在介绍的这个软件,相当于以上2个软件的结合版,即根据关键词爬取笔记的详情数据。
开发界面软件的目的:方便不懂编程代码的小白用户使用,无需安装python,无需改代码,双击打开即用!
爬取结果展示:
以上。
软件使用演示:(不懂编程的小白直接看视频,了解软件作用即可,无需看代码)
演示视频:【小红书采集软件】根据关键词自动采集笔记详情,含笔记正文、转评赞藏等
几点重要说明:
以上。
首先,定义接口地址作为请求地址:
定义一个请求头,用于伪造浏览器:
加上请求参数,告诉程序爬取条件是什么:
首先,定义接口地址作为请求地址:
定义一个请求头,用于伪造浏览器:
加上请求参数,告诉程序你的爬取条件是什么:
下面就是发送请求和接收数据:
逐个解析字段数据,以"笔记标题"为例:
熟悉xhs的朋友都知道,有些笔记是没有标题的,所以这里加上try保护,防止程序报错导致中断运行。
其他字段同理,不再赘述。
下面就是发送请求和接收数据:
定义一些空列表,用于存放解析后字段数据:
循环解析字段数据,以"笔记标题"为例:
其他字段同理,不再赘述。
最后,是把数据保存到csv文件:
完整代码中,还含有:判断循环结束条件、js逆向解密、笔记类型(综合/视频图文)筛选、排序方式筛选(综合/最新/最热)等关键实现逻辑。
这两个值非常重要,软件界面需要填写!!
开发者模式的打开方法:页面空白处->右键->检查。
主窗口部分:
底部版权部分:
以上。
好的日志功能,方便软件运行出问题后快速定位原因,修复bug。
核心代码:
以上。
软件使用演示:(不懂编程的小白直接看视频,了解软件作用即可,无需看代码)
演示视频:【小红书采集软件】根据关键词自动采集笔记详情,含笔记正文、转评赞藏等