小红书内容采集革命：XHS-Downloader 开源工具完全指南

张

张建站

2026/4/11 7:53:06

10分钟阅读

小红书内容采集革命XHS-Downloader 开源工具完全指南【免费下载链接】XHS-Downloader小红书XiaoHongShu、RedNote链接提取/作品采集工具提取账号发布、收藏、点赞、专辑作品链接提取搜索结果作品、用户链接采集小红书作品信息提取小红书作品下载地址下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader还在为保存小红书上的精彩内容而烦恼吗每次看到喜欢的穿搭教程、美食攻略、旅行分享却只能截图保存不仅麻烦还带着烦人的水印今天我要向你介绍一个彻底改变小红书内容采集体验的开源神器——XHS-Downloader 为什么你需要 XHS-Downloader想象一下你正在做市场调研需要收集竞品的100个爆款笔记或者你是个内容创作者想要整理自己的作品集又或者你只是单纯想保存那些让你心动的旅行攻略。传统的方法是什么截图录屏还是手动复制粘贴这些方法不仅效率低下而且质量堪忧。XHS-Downloader 正是为解决这些痛点而生这是一个基于 Python 开发的强大工具能够✅批量提取小红书账号发布、收藏、点赞、专辑作品链接✅智能采集作品详细信息包括图片、视频、文案等✅无水印下载原始高清文件告别模糊截图✅多格式支持自动识别并下载 WEBP、PNG、JPEG、HEIC 等格式✅智能去重自动跳过已下载内容节省时间和空间三分钟极速上手从零到批量下载第一步获取项目代码git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader cd XHS-Downloader第二步安装依赖两种方式任选方式一使用 pip传统方式pip install -r requirements.txt方式二使用 uv推荐速度更快uv sync --no-dev第三步启动程序python main.py就是这么简单三行命令你就拥有了一个功能强大的小红书内容采集工具。启动后你会看到一个直观的图形界面所有功能一目了然四大使用模式总有一款适合你1. 图形界面模式新手友好型如果你不习惯命令行图形界面是你的最佳选择。界面设计简洁直观批量输入支持一次性粘贴多个链接用空格分隔即可智能识别自动过滤无效链接只处理有效内容实时反馈下载进度、文件大小、完成状态一目了然配置灵活支持自定义保存路径、文件名格式等2. 命令行模式批量处理利器需要处理大量内容命令行模式让你事半功倍python main.py --url 链接1 链接2 链接3 \ --work_path ./我的收藏 \ --name_format {作者}_{标题}_{日期} \ --folder_mode True \ --image_format WEBP常用参数速查表参数简写功能说明默认值--url-u小红书作品链接必需无--work_path-wp文件保存路径./Volume/Download--name_format-nf自定义文件名格式{发布时间} {作者昵称} {作品标题}--folder_mode-fm是否为每个作品创建独立文件夹false--image_format-if图片格式PNG/WEBP/JPEG/HEICJPEG--max_retry-mr失败重试次数53. 浏览器脚本无缝网页集成安装 Tampermonkey 浏览器扩展后你可以直接在网页上操作脚本核心功能一键提取当前页面所有作品链接批量复制到剪贴板自动滚动加载更多内容直接推送下载任务到本地程序4. API/MCP 模式开发者专属如果你是开发者需要将功能集成到自己的应用中# API 模式启动 python main.py api # 访问 http://127.0.0.1:5556/docs 查看接口文档 # MCP 模式启动 python main.py mcp # 配置地址http://127.0.0.1:5556/mcp/ 实际应用场景看看别人怎么用场景一时尚博主的作品管理作为一名时尚博主我每个月都要整理自己的穿搭分享。使用 XHS-Downloader 后我的工作流程变得异常简单批量收集使用浏览器脚本一键提取所有发布作品链接智能分类设置--author_archive True按作者自动归档规范命名使用{发布时间}_{作品标题}格式保持文件有序定期更新每月运行一次脚本自动跳过已下载内容效率提升原本需要3小时的手动操作现在只需5分钟场景二市场分析师的数据采集市场研究需要大量竞品内容分析# 批量处理多个账号的作品 python main.py --url 竞品链接列表.txt \ --record_data True \ --image_format WEBP \ --proxy http://proxy.example.com:8080关键配置技巧开启record_dataTrue保存作品元数据到数据库使用代理服务器避免 IP 限制设置合理的请求间隔尊重平台规则场景三旅行爱好者的灵感收藏每次看到精彩的旅行攻略我都会在小红书收藏夹中整理相关内容使用用户脚本提取所有收藏作品链接批量下载到本地按目的地分类设置--folder_mode True为每个作品创建独立文件夹⚙️ 高级配置让你的下载更智能配置文件详解所有配置都保存在./Volume/settings.json文件中首次运行自动生成。你可以直接编辑这个文件重启程序后生效。核心配置项配置项类型说明默认值cookiestring小红书 Cookie非必需空image_formatstring图片格式AUTO/PNG/WEBP/JPEG/HEICJPEGfolder_modebool是否为每个作品创建独立文件夹falseauthor_archivebool是否按作者分类存储falsemax_retryint请求失败重试次数5script_serverbool是否开启用户脚本服务器false获取 Cookie 提升体验虽然 XHS-Downloader 无需登录也能使用但配置 Cookie 后可以获得更好的功能体验在小红书网页版按 F12 打开开发者工具切换到网络标签并勾选保留日志刷新页面找到任意请求中的 Cookie 字段并复制配置 Cookie 的好处解锁高清视频下载权限获得更稳定的数据采集避免频繁请求限制二次开发定制你的专属工具XHS-Downloader 采用模块化设计便于二次开发。核心模块结构清晰source/ ├── application/ # 应用层下载、请求、图片视频处理 ├── module/ # 核心模块模型、管理器、脚本处理 ├── expansion/ # 扩展功能浏览器集成、错误处理 ├── CLI/ # 命令行接口 ├── TUI/ # 图形界面 └── translation/ # 多语言支持简单集成示例查看 example.py 文件了解如何在自己的项目中集成from source import XHS async def custom_download(): async with XHS( work_path./my_downloads, name_format{作者昵称}_{作品标题}, image_formatWEBP, author_archiveTrue ) as xhs: result await xhs.extract( https://www.xiaohongshu.com/explore/xxx, downloadTrue ) print(result) 独特优势为什么选择 XHS-Downloader技术对比特性对比XHS-Downloader传统网页爬虫商业采集工具开源免费✅ 完全开源✅ 需自行开发❌ 付费订阅无水印下载✅ 原生支持❌ 需额外处理✅ 部分支持多模式操作✅ GUICLI脚本❌ 仅命令行✅ 主要GUI本地数据处理✅ 完全本地✅ 可实现❌ 部分云端处理反反爬机制✅ 内置优化❌ 需要自行实现✅ 内置但不透明二次开发支持✅ 完整API✅ 需要重构❌ 封闭系统社区支持✅ 活跃社区❌ 个人维护✅ 客服支持性能实测数据下载速度单作品平均3-8秒图文或10-25秒视频内存占用图形界面约50MB命令行模式约30MB并发处理支持批量处理多个链接充分利用网络带宽智能去重基于作品ID的重复检测避免重复下载常见问题与解决方案Q1下载速度慢怎么办解决方案检查网络连接稳定性调整chunk参数默认2MB根据网络状况适当增大避免同时运行过多下载任务使用代理服务器解决地域限制Q2哪些链接格式支持支持的链接格式https://www.xiaohongshu.com/explore/作品IDhttps://www.xiaohongshu.com/discovery/item/作品IDhttps://xhslink.com/分享码https://www.xiaohongshu.com/user/profile/作者ID/作品ID不支持的链接小红书App内的分享链接需转换为网页版链接已删除或私密作品需要特殊权限的内容Q3必须登录账号吗重要提示XHS-Downloader 无需登录小红书账号Cookie 配置主要是为了获取更好的视频画质和避免请求限制。即使不配置 Cookie 也能正常使用大部分功能。实用技巧与最佳实践技巧一批量处理大量链接# 将链接保存到文件每行一个 cat links.txt | xargs -I {} python main.py --url {} --folder_mode True技巧二定时自动采集结合系统定时任务实现自动采集# Linux/Mac 使用 crontab 0 2 * * * cd /path/to/XHS-Downloader python main.py --url 你的链接 download.log 21 # Windows 使用任务计划程序技巧三与数据库集成开启record_dataTrue后作品数据会保存到 SQLite 数据库方便后续分析import sqlite3 conn sqlite3.connect(./Volume/Download/ExploreData.db) # 查询所有作品数据 cursor conn.execute(SELECT * FROM explore_data)️ Docker 部署跨平台无忧运行如果你不想安装 Python 环境Docker 是最佳选择# 拉取镜像 docker pull joeanamier/xhs-downloader # 运行容器图形界面模式 docker run -p 5556:5556 -v xhs_downloader_volume:/app/Volume -it joeanamier/xhs-downloader # 运行容器API模式 docker run -p 5556:5556 -v xhs_downloader_volume:/app/Volume -it joeanamier/xhs-downloader python main.py apiDocker 优势无需安装 Python 环境跨平台一致性易于部署和维护社区与贡献XHS-Downloader 拥有活跃的开源社区如果你遇到问题或有改进建议查看文档项目 README 包含详细的使用说明提交 Issue在项目仓库中描述你遇到的问题参与开发遵循贡献指南为项目添砖加瓦贡献指南要点从develop分支创建功能分支使用 Ruff 工具保持代码格式统一提交信息格式类型: 简短描述确保新功能有相应的测试用例开始你的高效采集之旅XHS-Downloader 不仅仅是一个下载工具它是一个完整的小红书内容管理解决方案。无论你是内容创作者需要整理自己的作品集市场研究员需要分析竞品内容普通用户想要保存喜欢的笔记开发者需要集成内容采集功能都能在这个开源项目中找到合适的解决方案。立即开始克隆仓库、安装依赖、运行程序体验高效的小红书内容采集吧记住合理使用工具尊重原创内容遵守平台规则让技术为创作赋能而不是替代创作。如果你在使用的过程中有任何问题或建议欢迎加入社区讨论共同打造更好的开源工具【免费下载链接】XHS-Downloader小红书XiaoHongShu、RedNote链接提取/作品采集工具提取账号发布、收藏、点赞、专辑作品链接提取搜索结果作品、用户链接采集小红书作品信息提取小红书作品下载地址下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

1.2 环境搭建与项目结构

本节将带你完成 Flutter 开发环境的搭建，了解项目的目录结构，并掌握日常开发中最常用的命令行工具。一、Flutter SDK 安装与配置 1.1 系统要求操作系统最低要求WindowsWindows 10 64-bit（x86-64）macOSmacOS 10.14（…...

2026/4/11 7:50:31 阅读更多 →

【AI创意应用】AI创意，个人实践的内容和结果汇总

文章目录介绍内容和结果总结附录：魂斗罗附录：3D游戏附录：ikun-cli展示介绍 AI总给人一种啥也能做的幻觉，但是还是有多搞不定的东西，所以多数创意也是没法完整实现的，现汇总创意和结果如下表。内容和结果…...

2026/4/11 7:45:03 阅读更多 →

5步实现Elsevier期刊审稿状态自动化追踪：告别手动刷新的终极方案

5步实现Elsevier期刊审稿状态自动化追踪：告别手动刷新的终极方案【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 你是否每天焦虑地刷新Elsevier投稿系统，只为查看审稿进度？Elsevi…...

2026/4/11 7:44:03 阅读更多 →

ESP32硬件PWM控制库PWMOutESP32实战指南

1. PWMOutESP32 库深度解析：面向嵌入式工程师的 ESP32 PWM 控制实践指南 1.1 库定位与工程价值 PWMOutESP32 是一个专为 ESP32 系列微控制器设计的轻量级 PWM 输出控制库，其核心目标是提供 Arduino 风格的 pwm.analogWrite(pin, value) 接口&#xff…...

2026/4/10 2:36:05 阅读更多 →

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

1. LongerWatchDog 库概述：突破AVR看门狗定时器的固有约束在嵌入式系统开发中，看门狗定时器（Watchdog Timer, WDT）是保障系统可靠性的关键机制。传统Arduino平台（尤其是基于ATmega328P、ATmega2560等AVR架构的板卡&…...

2026/4/9 14:50:52 阅读更多 →

LeetCode 92. Reverse Linked List II 题解

LeetCode 92. Reverse Linked List II 题解题目描述给你单链表的头指针 head 和两个整数 left 和 right ，其中 left < right 。请你反转从位置 left 到位置 right 的链表节点，返回反转后的链表。示例 1： 输入：head [1,2,…...

2026/4/9 8:37:26 阅读更多 →