小红书笔记详情 API 是合规竞品分析的核心工具,其价值在于能获取标准化的笔记内容、互动数据、作者画像等信息,帮助品牌 / 开发者快速洞察竞品的内容策略、用户偏好、爆款逻辑。需要强调的是:仅可在获得官方授权或针对公开合规数据的前提下使用,严禁未经许可批量爬取或滥用数据。
一、 应用场景与核心分析维度
基于小红书笔记详情 API 返回的字段(标题、内容、标签、互动数据、作者信息等),可围绕竞品内容策略、用户需求、爆款规律三大核心方向展开分析。
| 分析维度 | 核心分析点 | 依赖 API 字段 | 分析价值 |
| 竞品内容策略 | 内容定位、发布频率、选题方向、内容形式(图文 / 视频) | note_type、category、tags、create_time、content | 明确竞品主打赛道,判断其内容差异化优势 |
| 用户偏好洞察 | 高互动内容特征、用户关注痛点、热门标签趋势 | like_count、collect_count、comment_count、tags | 提炼用户感兴趣的内容元素,指导自身选题 |
| 爆款规律总结 | 爆款笔记的标题公式、内容结构、发布时间 | title、content、create_time、interaction | 总结可复用的爆款方法论,提升内容成功率 |
| 竞品作者分析 | 竞品账号的粉丝质量、内容垂直度、商业化程度 | author.level、is_verified、is_commercial | 评估竞品账号的影响力与变现能力 |
二、 应用实践步骤(以品牌竞品分析为例)
1. 前置准备:明确分析目标与数据范围
- 确定竞品对象:筛选小红书内与自身品牌 / 产品直接竞争的账号(如美妆品牌 A vs 美妆品牌 B)。
- 申请 API 权限:通过小红书开放平台申请笔记详情 API与账号作品列表 API,获取合法调用资质。
- 定义数据采集范围:设定时间周期(如近 3 个月)、内容类型(如产品测评 / 种草笔记)、互动阈值(如点赞≥1000 的爆款笔记)。
2. 数据采集:基于 API 的批量合规获取
(1)获取竞品账号的笔记 ID 列表
先通过账号作品列表 API获取竞品账号下的所有笔记 ID,再批量调用笔记详情 API获取完整数据。
核心流程:
plaintext
竞品账号ID → 调用作品列表API → 得到笔记ID列表 → 批量调用笔记详情API → 结构化数据入库
(2)数据采集的效率与合规控制
- 频率控制:严格遵循 API 调用限额(如单 AppKey 10QPS、日调用 1 万次),通过异步分批请求避免限流。
- 数据去重:基于
note_id建立唯一索引,避免重复采集同一笔记。 - 字段筛选:仅采集分析所需字段(如标题、标签、互动数据),不获取冗余隐私信息。
3. 数据分析:从数据中提炼竞品策略
(1)竞品内容定位分析
- 步骤 1:提取竞品笔记的
category(分类)和tags(标签)字段,统计高频分类与标签。示例:竞品账号近 3 个月笔记中,“敏感肌护肤” 分类占比 40%,高频标签为 “敏感肌修护”“换季护肤”“平价面霜”,可判断其核心定位是敏感肌平价护肤。 - 步骤 2:对比
note_type(图文 / 视频)占比,分析内容形式偏好。示例:竞品视频笔记占比 65%,且视频笔记的平均点赞量是图文的 2 倍,说明其视频化内容策略更受用户欢迎。
(2)爆款笔记规律分析
- 标题规律:提取点赞≥5000 的爆款笔记标题,总结句式特征。示例:爆款标题多采用 “痛点 + 解决方案”(如 “换季烂脸?这瓶面霜救了我!”)或 “数字 + 效果”(如 “7 天淡化红血丝,亲测有效”)的结构。
- 内容结构:分析爆款笔记的
content字段,提炼内容框架。示例:爆款内容普遍遵循 “用户痛点→产品测评→使用前后对比→总结推荐” 的结构,且测评部分会突出 “成分安全”“无香精” 等敏感肌关注的点。
(3)用户偏好洞察
- 互动数据关联分析:将
tags与like_count/collect_count关联,找出高互动标签。示例:含 “敏感肌急救” 标签的笔记平均收藏量达 3200,远高于其他标签,说明敏感肌急救类内容的用户收藏意愿更强。 - 评论区需求挖掘:若 API 支持获取评论数据,可分析评论高频关键词,提炼用户未被满足的需求。示例:评论中高频出现 “适合干敏肌吗?”“有没有平替?”,说明用户关注肤质适配性和性价比。
(4)竞品商业化分析
- 提取
is_commercial(是否商业笔记)字段,统计商业笔记占比与互动数据。示例:竞品商业笔记占比 25%,且商业笔记的平均点赞量与非商业笔记持平,说明其商业化内容植入较为自然,用户接受度高。
4. 策略落地:将分析结果转化为行动方案
基于竞品分析结论,制定自身内容策略:
- 内容定位:聚焦 “敏感肌换季护肤” 细分赛道,填补竞品未覆盖的 “干敏肌冬季保湿” 需求。
- 内容形式:加大视频笔记投入,采用 “痛点 + 测评 + 对比” 的爆款结构。
- 标题优化:使用 “数字 + 效果” 的标题句式,提升点击率。
- 标签选择:优先使用 “敏感肌急救”“换季护肤” 等高互动标签。
三、 关键技术实现(Python 示例)
以下是基于 API 数据的竞品标签分析示例代码,用于统计高频标签及对应互动数据:
python
运行
import pandas as pd import matplotlib.pyplot as plt from collections import Counter # 假设已通过API获取并存储的竞品笔记数据(DataFrame格式) data = pd.DataFrame({ "note_id": ["note1", "note2", "note3"], "tags": [["敏感肌修护", "换季护肤"], ["平价面霜", "敏感肌"], ["敏感肌急救", "冬季保湿"]], "like_count": [2500, 3200, 4800], "collect_count": [1200, 1800, 2500] }) # 1. 展开标签数据,关联互动指标 tag_list = [] like_list = [] collect_list = [] for idx, row in data.iterrows(): for tag in row["tags"]: tag_list.append(tag) like_list.append(row["like_count"]) collect_list.append(row["collect_count"]) tag_df = pd.DataFrame({ "tag": tag_list, "like_count": like_list, "collect_count": collect_list }) # 2. 统计高频标签及平均互动数据 tag_stats = tag_df.groupby("tag").agg({ "tag": "count", "like_count": "mean", "collect_count": "mean" }).rename(columns={"tag": "note_num"}).sort_values("note_num", ascending=False) # 3. 可视化高频标签TOP10 top10_tags = tag_stats.head(10) plt.figure(figsize=(12, 6)) plt.bar(top10_tags.index, top10_tags["note_num"], color="#ff7f0e") plt.title("竞品笔记高频标签TOP10", fontsize=14) plt.xlabel("标签") plt.ylabel("笔记数量") plt.xticks(rotation=45) plt.tight_layout() plt.show() # 输出结果 print("高频标签及平均互动数据:") print(top10_tags)
四、 合规与风险注意事项
- 数据使用边界
- 仅可用于内部竞品分析,禁止将 API 获取的数据对外传播、贩卖或用于商业化推广。
- 不得提取作者隐私信息(如手机号、精准地址),仅使用公开的
nickname、avatar等字段。
- 避免触发风控
- 严格遵守 API 调用频率限制,不通过多账号叠加调用突破限额。
- 不针对同一竞品账号进行过度采集,单次分析的笔记数量建议控制在 1000 条以内。
- 应对 API 变更
- 关注小红书开放平台的 API 版本更新,及时调整代码适配新的字段或调用规则。
- 当 API 返回错误码(如 1003 频率超限、2002 权限不足)时,立即停止请求并排查原因。
五、 进阶应用:结合 AI 提升分析效率
- AI 内容解析:使用 NLP 模型(如 BERT)对笔记
content进行情感分析、关键词提取,自动提炼用户痛点。 - 爆款预测:基于历史笔记数据训练机器学习模型,预测不同标题、标签组合的互动效果。
- 实时监控:定时调用 API 获取竞品最新笔记,实时跟踪其内容策略变化。
是否需要我为你整理竞品分析数据可视化的完整代码模板,或者补充AI 关键词提取在笔记内容分析中的具体实现?