范围:基于 product-requirements.md 和 design.md,定义 BitFun 面向外部目标项目落地快速路径、配置化策略、安全边界、团队治理和复杂生命周期能力的阶段路线。
目标:每个阶段都交付短而明确的产品收益,同时保留必要技术跑道、API 预设、迁移准备和测试用例预设。
本计划以用户当期可感知收益为阶段主线。每条技术能力按最小可用切片进入阶段;模块完整度作为后台边界管理,完整边界能力可以跨阶段补齐。
技术跑道 P-1
-> P0 可解释的轻量开发闭环
-> P1 风险和远程状态可理解
-> P2 PR 协作和团队规则按需显露
-> P3 受管项目一致治理
-> P4 生命周期追溯与策略优化
每个阶段都必须回答四个问题:
- 用户今天能更快、更清楚或更安全地完成什么任务。
- 哪些技术前置必须先做,且不应伪装成用户价值。
- 哪些边界能力暂不完整,用户侧如何被解释和保护。
- 需求、开发、验证、审查和安全提示的质量要求是否相对一致。
| 原则 | 执行含义 |
|---|
| 收益切片优先 | 先选择能形成明确体验变化的最小闭环,不以模块完整度作为阶段目标 |
| 技术跑道显式化 | 事件、API、迁移、测试桩和空实现可以先做,但必须标注服务的产品收益和进入用户界面的时机 |
| 质量要求一致 | 同一阶段不能只对需求或 PR 设高要求,却让开发过程完全无约束;每个风险等级都要有相对一致的提示、验证和摘要 |
| 安全常驻先行 | prompt 注入、凭据、网络、shell、删除、发布、hook/MCP 和主动配置风险不等待后续治理阶段 |
| 能力声明先于执行 | tool、MCP、skills、插件、hook 和内置能力先声明能力、目标、数据类别和副作用;未知能力进入受限模式 |
| 用户语言优先 | 用户侧展示任务状态、原因、影响和下一步;内部策略画像和阶段名只在日志、设置或文档中出现 |
| 阶段边界可解释 | 未完成的沙箱、远程、证据、图谱或团队能力必须显示降级原因、替代路径或明确不可支持状态 |
| 可回放用例先行 | 每个阶段至少有低风险任务、安全确认、远程/不可支持状态和 PR/分享场景的回放用例 |
| 证据后台化 | 证据包、图谱和评测先服务摘要、就绪度、发布和复盘,不成为普通任务默认负担 |
| 指标保护体验 | 阶段评审同时看速度、打断、安全、质量、成本和后验反馈 |
| 反证驱动 | 一旦某切片增加提示噪音、误升级、误阻断或无用户收益,应降级、合并或延后 |
同一能力可以跨阶段出现。早期切片只交付最小用户收益,后续再补齐团队、审计、图谱或评测能力。
| 能力线 | P0 切片 | P1 切片 | P2 切片 | P3/P4 切片 |
|---|
| 项目理解 | 展示语言、脚本、规则来源、执行位置 | 解释验证能力缺口和推荐检查 | 读取团队路径规则和受保护分支 | 关联需求、发布、事故和历史质量反馈 |
| 任务结果 | 短摘要:改动、已验证、未验证、下一步 | 风险原因、跳过后果和替代验证 | PR 就绪度摘要和证据引用 | 发布/事故/复盘摘要 |
| 安全与沙箱 | allow/ask/deny、执行位置、授权范围、沙箱降级原因 | 沙箱状态块、远程不可支持状态和替代路径 | 项目/团队安全策略、风险接受和审计 | 企业受管 sandbox、跨项目审计导出 |
| 风险与验证 | 未验证项进入任务摘要 | 行内弱提示、推荐检查、不可运行原因 | 配置化强制检查和审查强度 | 后验缺陷、CI、审查反馈回流 |
| 团队规则 | 规则来源只作为上下文展示 | 冲突或受管信号折叠提示 | 路径规则、CODEOWNERS、PR 策略按需生效 | 合规批准、发布就绪和组织审计 |
| 证据与图谱 | 记录最小事件和验证摘要 | 生成证据引用,不默认完整包 | PR/团队场景投影证据包 | 交付物图谱、需求影响、事故回归 |
| 扩展与插件 | 预留 hook、事件、打点和候选契约 | 空实现、过期候选和幂等校验 | 工具复写契约和主动配置信任 | 插件适配主机原型、生态评测 |
| 指标与评测 | 建立速度、打断、安全和摘要覆盖基线 | 采样误升级、推荐检查和不可支持恢复 | 采样强制检查精度和 PR 采用 | 轨迹回放、策略 A/B、保留集 |
| 阶段 | 产品收益 | 纳入切片 | 必要技术前置 | 进入下一阶段条件 |
|---|
| P-1 | 不作为用户发布;明确产品边界和技术跑道 | 策略契约、安全契约、事件契约、阶段用例和指标口径 | LifecycleEvent、策略对象、配置优先级、测试桩、API 预设 | 能说明每个 P0/P1 切片服务的用户收益、降级解释和验收方法 |
| P0 | 用户能低摩擦完成低风险任务,并看懂安全范围和未验证项 | 轻量项目理解、任务短摘要、安全确认、执行位置、主动配置发现、最小 QDP | 项目扫描、基础安全决策、事件记录、摘要投影、关键回放用例 | 普通任务可完成;安全越界不静默;低风险任务不被重流程拖慢 |
| P1 | 风险、远程和不可支持状态变得可理解,用户知道该补什么验证 | 弱提示、推荐检查、远程/沙箱降级、Kernel 扩展点 v0、证据引用摘要 | 风险分类器、提示降噪、sandbox capability 事件、扩展点空实现 | 高风险解释清楚;低风险仍快速;远程和不可支持状态有替代路径 |
| P2 | 准备 PR 或进入团队规则时,用户获得可复制的协作摘要和规则说明 | PR 就绪度、团队规则折叠说明、风险接受、主动配置信任、工具复写契约 | 规则来源合成、PR 投影、风险接受记录、证据引用状态 | PR 摘要减少审查追问;团队规则来源可解释;强制项只在配置或确定性风险下出现 |
| P3 | 受管项目的需求、开发、验证、审查和发布质量要求保持一致 | 路径级强策略、完整证据包投影、最小图谱、发布/事故链接、组织审计 | 图谱边状态、证据过期、受管配置、发布和事故事件 | 复杂项目可追溯;阻断/批准来源明确;快速路径仍保留 |
| P4 | 用真实任务持续优化策略,淘汰无收益治理能力 | 轨迹回放、策略 A/B、评测卡、保留集、生态适配评估 | 回放环境、评测血缘、策略版本和成本采样 | 能用速度、质量、安全和成本联合评估治理策略 |
| 阶段 | 详细设计影响面 | 阶段结果 | 主要副作用和返工风险 | 质量管理方法 | 性能和成本看护 |
|---|
| P-1 | PRD、设计、事件信封、策略对象、安全边界、测试夹具、指标口径 | 技术跑道清晰;P0/P1 的收益、降级和验收方法可解释 | 契约过度设计导致后续实现被早期字段锁死;事件和策略对象未服务真实体验;测试夹具只覆盖理想路径 | 契约评审必须逐项映射 PRD、事件、用例和指标;新增字段要声明生产者、消费者和删除条件 | 不设用户路径预算;限制设计期事件和指标数量,避免 P0 一开始背负遥测膨胀 |
| P0 | 项目打开、项目上下文条、任务短摘要、安全确认、远程执行位置、主动配置发现、最小 QDP | 低风险任务能完成;用户看到已验证/未验证、安全范围、执行位置和下一步 | 默认体验被安全/摘要/扫描拖慢;项目扫描误判后形成强策略;安全确认过多;沙箱能力被夸大;主动配置发现误阻断普通任务 | 回放低风险任务、安全高敏动作、远程容器、主动配置发现;摘要必须包含未验证项;安全与质量事件分开审计 | 首次有用动作以 P0 基线为准;项目扫描分层、可取消、可延后;安全确认和摘要渲染不阻塞工具结果展示;QDP 只采最小事件 |
| P1 | 风险提示、推荐检查、远程不可支持状态、沙箱降级说明、Kernel 扩展点、证据引用摘要 | 用户能理解风险和能力缺口,并知道补什么验证 | 风险提示泛化成噪音;推荐检查不可运行;远程缺口被本地验证掩盖;扩展点空实现被误认为可用插件能力;证据引用缺少新鲜度 | 中/高风险用例必须说明原因、证据、建议和跳过后果;推荐检查要有不可运行分支;扩展点候选不能写权威状态 | 风险分类和提示生成后台化;同类提示合并;扩展点有 deadline、epoch、幂等键;证据引用只保存摘要和引用 |
| P2 | PR 就绪度、团队规则来源、路径规则、风险接受、主动配置信任、工具复写契约 | PR 或团队场景可获得可复制摘要和规则说明;普通任务不被团队流程打断 | 团队规则冲突导致误阻断;PR 摘要生成过重;风险接受被滥用;工具复写绕过安全;未信任主动配置产生假通过 | PR/团队用例抽样验证规则来源、强制项、风险接受和撤销;风险接受必须记录范围、原因、操作者、期限;工具复写重新经过安全边界 | PR 投影按需生成;证据引用增量更新;团队规则读取缓存并可解释失效;不创建默认强制 GitHub 检查 |
| P3 | 路径级强策略、完整证据包投影、最小交付物图谱、需求/API/架构影响候选、发布/事故事件 | 受管项目的需求、实现、验证、审查、发布和风险接受强度一致 | 图谱误关联造成错误责任链;证据过期未失效;需求质量很高但开发/验证仍低保障;发布阻断来源不清;普通任务被图谱拖慢 | 受管路径抽样检查质量一致性;图谱边必须有来源、新鲜度和确认状态;发布就绪区分事实、候选和风险接受 | 图谱和证据只在 PR、发布、事故、合规场景显露;增量计算优先;过期重算后台化;普通任务保留短摘要 |
| P4 | 轨迹回放、评测卡、策略 A/B、保留集、成本采样、生态适配评估 | 策略能用真实任务持续优化,低价值治理能力可下线 | 评测集污染;只优化强管控任务;A/B 影响用户信任;成本指标压倒质量;插件生态评估反向推动不成熟运行时提前接入 | 每个评测任务有血缘、泄漏状态和判定标准;A/B 只在可回滚策略上运行;后验缺陷、审查阻塞和用户反馈共同校准 | 回放和评测离线或低优先级执行;token、墙钟耗时、工具调用和提示次数进入评测卡;生态适配默认不改变内核权威状态 |
| 风险类型 | 触发方式 | 可能后果 | 预防和回退 |
|---|
| 默认体验变重 | P0/P1 把证据包、图谱、深度审查或团队规则提前显露 | 低风险任务完成变慢,用户认为产品只适合强流程项目 | 默认只展示短摘要和必要安全确认;复杂能力按 PR、团队、发布、事故和合规触发;打断率和首次有用动作耗时超基线时降级 |
| 质量要求断层 | 需求或 PR 阶段要求很高,但开发过程中缺少风险提示、验证建议或未验证摘要 | 用户在末端突然被阻断,返工集中在 PR 或发布前 | quality.consistency.sampled 抽样检查需求、开发、验证、审查、发布强度;受管路径从开发中就显示规则来源和验证缺口 |
| 风险误升级 | 风险分类把文档、小范围非核心改动或个人任务升级到团队治理 | 提示噪音、误阻断、用户绕过安全确认 | 风险等级只驱动建议和展示层级;阻断只能来自安全拒绝、组织策略、确定性失败或明确强制策略 |
| 风险漏报 | 小 diff 命中安全、权限、schema、远程、发布或主动配置 | 高风险变更通过轻量路径,后续缺陷或安全事件返工 | 路径、动作、主动配置和历史风险优先于 diff 行数;高风险低置信进入降级状态和推荐检查 |
| 沙箱误表述 | 只有用户确认或工作区快照,却展示为系统级隔离 | 用户误判安全边界,安全事故后需要重做授权模型 | allow_in_sandbox 只在真实隔离可用时出现;沙箱等级组合、降级原因和残余风险写入 security.decided |
| 远程/本地语义漂移 | 本地扫描、测试或路径判断被用于远程 SSH、容器或云端任务 | 无效验证、路径误写、权限扩大 | 所有工具和摘要显示执行位置、路径映射、端口/网络边界;本地能力不可替代远程能力,缺口必须给替代路径 |
| 事件和指标膨胀 | P0 就采集完整日志、轨迹、证据和图谱字段 | 性能下降、隐私风险、事件迁移成本变高 | P0 只采最小 QDP;新事件必须声明生产者、消费者、保留周期、隐私分级和删除条件 |
| 证据或图谱过期 | 新提交、策略变化、验证失败、审查范围变化后仍复用旧证据 | PR、发布或事故复盘引用错误事实 | 证据和图谱边带新鲜度、来源和确认状态;过期后只能作为历史引用,不能作为通过依据 |
| 团队规则冲突 | AGENTS、CODEOWNERS、CI、工具配置和组织策略给出不同要求 | 误阻断、重复检查、规则不可解释 | 配置优先级固定;冲突显示来源和作用域;不能静默选择高风险路径 |
| 插件和工具复写越权 | 外部插件、OpenCode 适配层或工具复写候选直接影响权威状态 | 执行链不可信,后续需要重构 Kernel/Host 边界 | P0/P1 只保留 Kernel 扩展点和候选契约;候选不能写通过、失败、阻断、审计或授权状态 |
| 性能优化牺牲安全 | 为了减少弹窗或延迟,把安全确认合并到质量覆盖或默认允许 | 安全边界被质量流程稀释 | 安全决策独立常驻;降噪只能通过范围限制、白名单、真实沙箱和一次性授权实现 |
| 评测过拟合 | 策略只针对固定任务集或强治理样本优化 | 普通项目体验变差,真实任务收益下降 | 评测卡记录血缘和污染状态;低风险、远程、安全、PR、受管路径都必须保留样本 |
P-1 是内部跑道,不应作为用户可见“新能力”发布。它的价值是避免后续阶段为了补契约反复返工。
| 交付件 | 内容 | 验收方式 |
|---|
| 阶段收益切片表 | 将每条能力线拆成 P0-P4 可交付用户收益、技术前置和延期边界 | 每个切片都能对应 PRD、设计模块、事件和测试方法 |
| 配置化策略契约 | 内部策略画像、原因、展示层级、检查、审查策略、覆盖选项 | 能解释每次提示、升级、阻断来源 |
| 体验投影契约 | 将内部策略画像映射为用户可见状态、弱提示、确认、设置和日志 | 用户无需学习内部模式也能理解当前状态 |
| 产品需求映射 | 将 PRD 中目标、画像、体验路径和功能需求映射到策略对象、界面状态、事件和验收方法 | 能说明能力如何服务不同人群和任务阶段 |
| 关键用例清单 | 低风险开发、安全确认、远程上下文、PR 就绪、受管路径、主动配置信任的回放用例 | 每个 PRD-18 用例都有入口、默认状态、体验收益和验证方法 |
| 安全边界契约 | 权限、执行位置、沙箱等级组合、网络、凭据、主动配置信任、应急放行 | 安全决策不依赖门禁或质量策略 |
| 能力/效果模型契约 | tool、MCP、skills、插件、hook 和内置能力统一声明能力、目标、数据类别、信任来源和副作用候选 | 新扩展不需要修改策略核心即可进入安全判定;未声明能力默认受限 |
| 执行与沙箱矩阵 | 本地、远程、ACP、MCP、MiniApp/前端、插件适配主机、浏览器/桌面、云端任务的执行位置、隔离等级、降级原因和用户选项 | allow_in_sandbox 只在真实隔离可用时出现 |
| Kernel 扩展点契约 | 生命周期 hook、事件信封、打点、工具复写候选、插件效果候选、deadline、epoch 和幂等键 | 未来适配器可接入,空实现不影响默认任务 |
| 最小事件注册表 | project.opened、task.started、policy.decided、security.decided、verification.completed、task.completed、stage.outcome.evaluated、quality.consistency.sampled、performance.budget.evaluated | 快速路径、安全提示、任务摘要、阶段收益、质量一致性和性能回退可追踪 |
| 产品指标规格 | 首次有用动作耗时、打断率、阶段收益达成率、质量一致性缺口率、应急放行率 | 阶段验收不只看技术完成度 |
退出条件:可以描述 P0/P1 每个切片的用户收益、技术前置、降级解释和回放方法;每个高权限动作都有 allow/ask/deny/应急放行路径。
让用户打开任意外部项目后,能快速完成一次低风险开发任务,并在不理解内部治理术语的情况下获得简洁结果、安全范围和未验证项说明。
| 用户可见收益 | 必要实现 | 明确不做或延期 |
|---|
| 项目上下文条能说明项目、执行位置、主要入口和规则来源 | 轻量扫描语言、包管理器、常用脚本、git 状态、README/AGENTS/CONTRIBUTING/CI 入口 | 不完整建模模块边界,不用推断结果形成强制策略 |
| 任务结束有短摘要 | 记录改动、已运行命令、未验证项、下一步建议和信心摘要 | 不默认展示完整证据包、图谱或 PR 门禁 |
| 安全动作有低噪音确认 | 工作区写、shell、网络、凭据、删除、跨根目录写入基础决策,记录执行位置、沙箱等级组合和降级原因 | 不声称具备未实现的运行时沙箱 |
| 远程或云端执行位置可见 | 识别本地、SSH、容器、远程工作区、云端异步任务和不可用本地能力 | 不把本地能力投影为远程能力 |
| 主动配置默认安全 | 发现 hook、plugin、MCP、自定义工具、工具复写和智能体规则,默认未信任且不执行 | 不执行外部插件运行时 |
| 低风险任务也有一致质量说明 | 低风险任务摘要必须包含已验证、未验证、跳过原因和建议补证路径 | 不要求深度审查、强制检查或完整需求分析 |
| 阶段数据可采样 | 记录任务、工具、验证、安全决策、用户覆盖、摘要生成、阶段收益和质量一致性抽样事件 | 不用指标阻塞 P0 用户任务 |
- 质量保障要求较低的探索性改动可以快速获得可用结果和短摘要。
- 常规项目可以在不配置
.bitfun 的情况下识别主要开发命令。
- 用户默认不需要理解内部策略模式。
- 安全敏感动作会提示原因、范围、执行位置和可选隔离路径。
- 权限确认、快照/worktree 隔离和运行时沙箱在提示中分开表达;没有真实隔离时不展示为沙箱允许。
- 远程项目能展示执行主机、工作区根、权限边界和不可用能力。
- 用户可以一次性放行低/中风险越界,但不能静默持久化。
- 低风险任务虽然不强制检查,但仍保留已验证/未验证项、跳过原因和下一步。
- 低风险任务、安全确认和远程容器用例可回放,布局、文案、交互和用户收益符合 PRD-18。
| 风险 | 处置 |
|---|
| 为了安全把 P0 做重 | 优先用范围限制、沙箱、白名单和短确认降噪 |
| 沙箱能力被夸大 | security.decided 必须记录实际沙箱等级组合和降级原因,文案禁止把权限确认描述成系统级隔离 |
| 项目理解不准 | 推断结论只用于提示,不用于强策略 |
| 低风险任务质量解释不足 | 任务摘要必须列出已验证、未验证和跳过原因 |
| 远程上下文不清 | 先提示执行位置和能力缺口,不自动扩大权限 |
当任务出现风险、远程环境差异或验证缺口时,BitFun 解释为什么需要额外动作,并给出可执行的检查、替代验证或降级路径。
| 用户可见收益 | 必要实现 | 明确不做或延期 |
|---|
| 中风险动作有行内弱提示 | 路径、模块、操作、历史信号和安全敏感标签进入风险提示 v0 | 不默认弹窗,不默认深度审查 |
| 推荐检查可执行或可解释 | 推荐验证命令、替代验证、不可运行原因和跳过后果 | 不把推荐检查等同阻断 |
| 远程不可支持状态可恢复 | 私有依赖、本地二进制、端口、凭据或权限不可用时给替代路径 | 不假装本地检查覆盖远程环境 |
| 沙箱降级可见 | 本地/远程/ACP/MCP/插件/浏览器/云端执行面的状态块、降级说明和替代路径 | 不把权限确认包装成沙箱 |
| 扩展点可预留但不干扰 | 稳定事件、hook 注册点、打点、工具复写候选契约和空实现 | 不执行 OpenCode 插件,不让候选写权威状态 |
| 证据引用按需出现 | 只生成摘要和证据引用,服务任务摘要和后续 PR | 不默认生成完整证据包 |
- 低风险改动不触发深度审查。
- 高风险或中风险改动能解释升级原因、建议检查和跳过后果。
- 同类提示不会在同一任务中反复弹窗。
- CI、私有环境或远程能力不可运行时输出替代建议、信心影响和后续补证路径。
- 扩展点无适配器、空实现或返回过期候选时,不影响内核权威状态。
- 风险提示、推荐检查、沙箱降级和远程不可支持用例可回放。
用户准备 PR、分享变更或命中团队规则时,BitFun 提供可复制的协作摘要、规则来源和风险接受入口,而不影响普通任务中间过程。
| 用户可见收益 | 必要实现 | 明确不做或延期 |
|---|
| PR 就绪度可复制 | 变更、验证、未验证项、风险、证据引用和复制到 PR 的 Markdown 块 | 不默认创建强制 GitHub 检查 |
| 团队规则来源可解释 | AGENTS、CONTRIBUTING、CODEOWNERS、CI、.github/instructions、.coderabbit.yaml、.gitlab/duo 读取和来源展示 | 不让冲突规则静默生效 |
| 受管路径有折叠说明 | 路径规则、审查强度、强制检查和冲突状态按需展示 | 不把所有团队配置变成默认首屏 |
| 风险接受可追踪 | 操作者、原因、范围、残余风险、过期时间和撤销入口 | 不允许绕过安全拒绝和组织拒绝策略 |
| 主动配置可先审后用 | hook、plugin、MCP、自定义工具和工具复写记录来源、hash、权限和信任状态 | 不执行未信任主动配置 |
| 工具复写有契约 | 定义内核工具表、复写候选、权限校验和撤销入口 | 外部插件运行时接入延后 |
- PR 摘要减少审查人追问,但不默认阻塞。
- 团队能用仓库配置统一体验,个人一次性任务仍使用个人默认值。
- 路径规则冲突能显示并要求确认。
- 强制要求或阻断有明确来源,不由模型单独触发。
- 工具复写契约不会跨项目生效,也不会绕过文件、shell、网络和凭据策略。
- PR 就绪、受管路径、风险接受和主动配置信任用例可回放。
为高质量要求、受管路径、发布和事故相关任务提供一致治理。需求、开发、验证、审查、发布和风险接受不应出现明显强弱断层。
| 用户可见收益 | 必要实现 | 明确不做或延期 |
|---|
| 受管项目质量要求一致 | 路径级强策略、审查强度、强制检查、风险接受和发布要求共同生效 | 不把单个需求文档质量当成全部质量保证 |
| 完整证据包按场景投影 | 团队、发布、事故或合规场景生成可追踪证据包 | 普通任务仍只看摘要 |
| 最小交付物图谱可解释 | diff -> verification -> evidence_pack -> PR,并支持过期状态 | 不把未确认图谱边当成事实 |
| 需求/API/架构影响候选可确认 | 高风险需求、API、权限、数据和架构变更给影响候选和人工确认 | 不由模型直接写入权威影响事实 |
| 发布和事故回流 | 发布就绪度、回滚风险、事故到回归候选和规则更新 | 不要求所有项目一次性启用 |
- 普通任务不需要看到图谱或完整证据包。
- 复杂 PR 可以解释证据和关系来源。
- 发布就绪度能说明可发布、不可发布或已接受风险。
- 事故能转成回归候选或规则更新。
- 受管任务抽样时,需求、实现、验证、审查和发布要求强度一致。
用真实任务和产品指标优化智能体行为、治理策略和质量治理,避免只优化基准测试或只优化强管控。
| 交付件 | 内容 |
|---|
| 轨迹回放 | 回放任务、命令、验证、提示、覆盖和安全决策 |
| 评测卡 | 任务集、判定标准、模型/上下文/工具/策略版本、成本、安全事件 |
| 治理策略 A/B | 比较提示频率、误升级、成功率、用户放行和质量结果 |
| 保留集 | 防泄漏任务集和真实项目回归 |
| 策略校准 | 合入后缺陷、审查阻塞项、CI 失败和用户反馈回流 |
| 生态适配评估 | OpenCode 等插件系统作为适配层评估,不改变内核权威状态 |
- 能证明新策略没有让普通任务变慢。
- 能证明安全提示减少盲目确认。
- 能证明高风险场景质量更稳定。
- 能发现哪些门禁、审查、图谱或证据能力没有产品价值,应下线或降级。
每个阶段退出前必须抽样检查同一风险等级下的体验强度是否一致。
| 场景 | 需求/意图 | 开发过程 | 验证 | 审查/分享 | 必须避免 |
|---|
| 低风险个人任务 | 简短任务目标即可 | 低干预、必要安全确认 | 可选检查,摘要记录未验证项 | 不默认 PR 门禁 | 要求完整需求说明却不说明开发未验证风险 |
| 中风险变更 | 说明风险来源和影响范围 | 行内弱提示和推荐检查 | 推荐检查或替代验证 | 分享/PR 时展示未验证项 | 风险提示很多但没有下一步 |
| 受管路径 | 读取团队规则和路径要求 | 按规则提示或阻断 | 强制检查有来源 | PR 就绪度和风险接受 | 只在 PR 阶段突然加重流程 |
| 安全高敏动作 | 展示命令、范围、执行位置和后果 | 安全边界独立确认 | 记录授权、沙箱和降级 | 审计和撤销入口 | 把质量覆盖当成安全授权 |
| 远程/云端任务 | 标注执行域和不可用能力 | 不假设本地能力可用 | 给替代验证或补证路径 | 摘要说明环境差异 | 本地验证结果冒充远程验证 |
| 闸口 | 检查项 | 不满足时的处理 |
|---|
| 用户收益 | 阶段至少有一个可回放用户场景达到预期体验结果,并能说明未完成边界 | 不发布为阶段完成;只能作为技术跑道或实验能力记录 |
| 质量一致性 | 同一风险等级下,需求、开发、验证、审查和发布强度没有明显断层 | 降低阶段范围,或补齐开发中提示、验证建议、风险接受记录 |
| 风险副作用 | 新增提示、确认、规则、证据或图谱没有引入明显误升级、误阻断、隐私扩大或安全误表述 | 默认关闭该切片,改为设置项、实验开关或后台记录 |
| 性能看护 | 首次有用动作、用户打断率、后台扫描耗时、事件载荷和 token/工具成本没有超过阶段预算 | 延后后台分析、降低采样、只保留摘要,或回滚高成本切片 |
| 降级和回退 | 每个新切片都有不可用状态、降级文案、替代路径和关闭方式 | 不允许进入默认路径 |
| 数据和隐私 | 新事件、证据、日志、评测轨迹都声明隐私分级、保留周期和导出策略 | 不采集原始数据,只保留脱敏摘要或引用 |
| 预算项 | 口径 | 回退策略 |
|---|
| 首次有用动作 | P0 建立基线;P1 以后默认路径不得无解释高于上一阶段基线 | 延后项目深扫、证据生成、图谱更新和评测采样 |
| 项目扫描 | 轻量扫描先返回入口、脚本、规则来源和执行位置;完整建模后台化 | 取消或降级为“未知区域”,不阻塞任务开始 |
| 提示与确认 | 同一任务、同一原因、同一范围只出现一次强提示;低价值提示合并到摘要 | 合并、延后、折叠或进入任务结束摘要 |
| 证据和图谱 | 只在 PR、团队、发布、事故或合规场景计算完整投影 | 默认只保留摘要和引用,过期重算后台执行 |
| QDP 事件 | 新事件字段必须服务用户收益、风险解释、质量一致性或性能看护 | 删除字段、降采样、缩短保留周期或只保存脱敏引用 |
| 模型和工具成本 | 深度审查、影响分析、评测回放、插件适配评估默认不进入低风险路径 | 改为用户触发、团队配置触发或离线任务 |
详细口径见 metrics-spec.md。P0/P1 必须优先看这些指标:
- 首次有用动作耗时。
- 阶段收益达成率。
- 质量一致性缺口率。
- 阶段性能回退率。
- 事件载荷预算命中率。
- 用户打断率。
- 弹窗触发率。
- 重复提示抑制率。
- 安全提示接受/忽略率。
- 应急放行率和范围。
- 沙箱降级率和降级原因分布。
- 误升级率。
- 低风险任务完成率。
- 推荐检查执行率。
- PR 就绪度采用率。
- 远程不可支持状态恢复率。
- 跨入口语义一致率。
- 强制检查精度。
- 合入后缺陷 / 审查阻塞项反馈。
- 每次阶段发布必须说明用户可见收益、必要技术前置、延期边界和降级解释。
- P0/P1 默认不创建强制 GitHub 检查;优先本地摘要和 PR 文本块。
- 团队治理开启后,才将就绪度或门禁投影到 PR 状态/评论。
- 阻断只允许来自安全边界、组织策略、确定性失败或明确强制要求策略。
- 每次发布 PR 文档必须说明默认体验是否变重,以及如何避免普通项目被重流程影响。
| 里程碑 | 判定标准 |
|---|
| M0:收益切片清晰 | 每条能力线都有用户收益、技术前置、延期边界和验收方法 |
| M1:轻量闭环可用 | 普通项目无需配置即可完成有用开发任务,并看懂已验证/未验证项 |
| M2:风险状态可解释 | 风险、远程、沙箱和不可支持状态有原因、替代路径和低噪音提示 |
| M3:协作摘要可复用 | PR/团队场景可复用就绪度、规则来源、风险接受和证据引用 |
| M4:受管质量一致 | 需求、开发、验证、审查、发布和风险接受强度一致 |
| M5:复杂项目可追溯 | 证据包/图谱支撑 PR/发布/事故,快速路径保留轻量摘要 |
| M6:策略可评估 | 治理策略能用效率、质量、安全和成本联合衡量 |
这组能力完成时,BitFun 应表现为:
- 普通开发像轻快助手,且一直说明已验证和未验证内容。
- 高风险动作像可靠安全执行环境,且不把授权误称为沙箱。
- 团队项目像可配置协作系统,且规则来源和强制项可解释。
- 复杂项目像可追溯工程平台,且图谱和证据按场景显露。
- 所有复杂技术都服务于明确体验:更快完成任务、更准识别风险、更清楚解释信心或更可靠复盘。