xhs_factory/spec.md at main

zhoujie/xhs_factory

Fork 0

zhoujie 4d83c0f4a9

CI / Lint (ruff) (push) Has been cancelled

Details

CI / Import Check (push) Has been cancelled

Details

✨ feat(scheduler): 新增热点自动采集功能并优化发布路径

- 新增热点自动采集后台线程，支持定时搜索关键词并执行 AI 分析，结果缓存至结构化状态
- 新增热点分析状态管理接口，提供线程安全的 `get_last_analysis` 和 `set_last_analysis` 方法
- 新增热点数据桥接函数 `feed_hotspot_to_engine`，将分析结果注入 TopicEngine 实现热点加权推荐
- 新增热点选题下拉组件，分析完成后自动填充推荐选题，选中后自动写入选题输入框
- 优化 `generate_from_hotspot` 函数，自动获取结构化分析摘要并增强生成上下文
- 新增热点自动采集配置节点，支持通过 `config.json` 管理关键词和采集间隔

♻️ refactor(queue): 实现智能排期引擎并统一发布路径

- 新增智能排期引擎，基于 `AnalyticsService` 的 `time_weights` 自动计算最优发布时段
- 新增 `PublishQueue.suggest_schedule_time` 和 `auto_schedule_item` 方法，支持时段冲突检测和内容分布控制
- 修改 `generate_to_queue` 函数，新增 `auto_schedule` 和 `auto_approve` 参数，支持自动排期和自动审核
- 重构 `_scheduler_loop` 的自动发布分支，改为调用 `generate_to_queue` 通过队列发布，统一发布路径
- 重构 `auto_publish_once` 函数，移除直接发布逻辑，改为生成内容入队并返回队列信息
- 新增队列时段使用情况查询方法 `get_slot_usage`，支持 UI 热力图展示

📝 docs(openspec): 新增内容排期优化和热点探测优化规范文档

- 新增 `smart-schedule-engine` 规范，定义智能排期引擎的功能需求和场景
- 新增 `unified-publish-path` 规范，定义统一发布路径的改造方案
- 新增 `hotspot-analysis-state` 规范，定义热点分析状态存储的线程安全接口
- 新增 `hotspot-auto-collector` 规范，定义定时热点自动采集的任务流程
- 新增 `hotspot-engine-bridge` 规范，定义热点数据注入 TopicEngine 的桥接机制
- 新增 `hotspot-topic-selector` 规范，定义热点选题下拉组件的交互行为
- 更新 `services-queue`、`services-scheduler` 和 `services-hotspot` 规范，反映功能修改和新增参数

🔧 chore(config): 新增热点自动采集默认配置

- 在 `DEFAULT_CONFIG` 中新增 `hotspot_auto_collect` 配置节点，包含 `enabled`、`keywords` 和 `interval_hours` 字段
- 提供默认关键词列表 `["穿搭", "美妆", "好物"]` 和默认采集间隔 4 小时

🐛 fix(llm): 增强 JSON 解析容错能力

- 新增 `_try_fix_truncated_json` 方法，尝试修复被 token 限制截断的 JSON 输出
- 支持多种截断场景的自动补全，包括字符串值、数组和嵌套对象的截断修复
- 提高 LLM 分析热点等返回 JSON 的函数的稳定性

💄 style(ui): 优化队列管理和热点探测界面

- 在队列生成区域新增自动排期复选框，勾选后隐藏手动排期输入框
- 在日历视图旁新增推荐时段 Markdown 面板，展示各时段权重和建议热力图
- 在热点探测 Tab 新增推荐选题下拉组件，分析完成后动态填充选项
- 在热点探测 Tab 新增热点自动采集控制区域，支持启动、停止和配置采集参数

2026-02-28 22:22:27 +08:00

2.4 KiB

Raw Permalink Blame History

ADDED Requirements

Requirement: 最优时段计算

系统 SHALL 基于 AnalyticsService 的 time_weights 数据计算每个 3 小时段的权重得分，并按得分降序排列为候选时段列表。

Scenario: 有分析数据时按权重排序

WHEN time_weights 包含至少 1 个时段的权重数据
THEN suggest_schedule_time() SHALL 按 weight 值降序排列时段，优先返回高权重时段的具体时间

Scenario: 无分析数据时使用默认时段

WHEN time_weights 为空字典或不存在
THEN 系统 SHALL 使用默认的高流量时段作为候选：08-11 时（权重 70）、12-14 时（权重 60）、18-21 时（权重 85）、21-24 时（权重 75）

Requirement: 时段冲突检测

系统 SHALL 在分配排期时间前查询已有队列排期，避免同一时段内容拥堵。

Scenario: 单时段内容上限控制

WHEN 某个 3 小时时段中已排期的队列项数量达到 max_per_slot（默认 2）
THEN 系统 SHALL 跳过该时段，选择下一个权重最高且有空余的时段

Scenario: 单日内容上限控制

WHEN 某天的已排期总数达到 max_per_day（默认 5）
THEN 系统 SHALL 将内容排期到次日的最优可用时段

Scenario: 最远排期范围

WHEN 未来 7 天内所有时段均已满
THEN suggest_schedule_time() SHALL 返回 None，内容以 approved 状态入队（不带排期时间）

Requirement: 排期时间精确化

系统 SHALL 在选定的 3 小时段内随机选择一个精确的分钟级时间点，避免所有内容在整点发布。

Scenario: 时段内随机时间

WHEN 系统选定 18-21 时段为最优
THEN SHALL 在该时段范围内随机生成精确时间（如 2026-02-28 19:37:00），格式为 %Y-%m-%d %H:%M:%S

Requirement: 队列项自动排期

PublishQueue SHALL 提供 auto_schedule_item(item_id, analytics) 方法，为指定队列项调用排期引擎并更新其 scheduled_time。

Scenario: 自动排期成功

WHEN 调用 auto_schedule_item(item_id, analytics) 且队列项状态为 draft 或 approved
THEN 系统 SHALL 计算最优时间并更新该项的 scheduled_time 和状态为 scheduled

Scenario: 自动排期无可用时段

WHEN 调用 auto_schedule_item() 但未来 7 天无可用时段
THEN 系统 SHALL 保持队列项当前状态不变，返回 False

2.4 KiB Raw Permalink Blame History Unescape Escape