BitFun 可配置开发体验与工程治理实施计划

June 12, 2026 · View on GitHub

范围：基于 product-requirements.md 和 design.md，定义 BitFun 面向外部目标项目落地快速路径、配置化策略、安全边界、团队治理和复杂生命周期能力的阶段路线。目标：每个阶段都交付短而明确的产品收益，同时保留必要技术跑道、API 预设、迁移准备和测试用例预设。

1. 执行定位

本计划以用户当期可感知收益为阶段主线。每条技术能力按最小可用切片进入阶段；模块完整度作为后台边界管理，完整边界能力可以跨阶段补齐。

技术跑道 P-1
  -> P0 可解释的轻量开发闭环
  -> P1 风险和远程状态可理解
  -> P2 PR 协作和团队规则按需显露
  -> P3 受管项目一致治理
  -> P4 生命周期追溯与策略优化

每个阶段都必须回答四个问题：

用户今天能更快、更清楚或更安全地完成什么任务。
哪些技术前置必须先做，且不应伪装成用户价值。
哪些边界能力暂不完整，用户侧如何被解释和保护。
需求、开发、验证、审查和安全提示的质量要求是否相对一致。

2. 执行原则

原则	执行含义
收益切片优先	先选择能形成明确体验变化的最小闭环，不以模块完整度作为阶段目标
技术跑道显式化	事件、API、迁移、测试桩和空实现可以先做，但必须标注服务的产品收益和进入用户界面的时机
质量要求一致	同一阶段不能只对需求或 PR 设高要求，却让开发过程完全无约束；每个风险等级都要有相对一致的提示、验证和摘要
安全常驻先行	prompt 注入、凭据、网络、shell、删除、发布、hook/MCP 和主动配置风险不等待后续治理阶段
能力声明先于执行	tool、MCP、skills、插件、hook 和内置能力先声明能力、目标、数据类别和副作用；未知能力进入受限模式
用户语言优先	用户侧展示任务状态、原因、影响和下一步；内部策略画像和阶段名只在日志、设置或文档中出现
阶段边界可解释	未完成的沙箱、远程、证据、图谱或团队能力必须显示降级原因、替代路径或明确不可支持状态
可回放用例先行	每个阶段至少有低风险任务、安全确认、远程/不可支持状态和 PR/分享场景的回放用例
证据后台化	证据包、图谱和评测先服务摘要、就绪度、发布和复盘，不成为普通任务默认负担
指标保护体验	阶段评审同时看速度、打断、安全、质量、成本和后验反馈
反证驱动	一旦某切片增加提示噪音、误升级、误阻断或无用户收益，应降级、合并或延后

3. 收益切片队列

同一能力可以跨阶段出现。早期切片只交付最小用户收益，后续再补齐团队、审计、图谱或评测能力。

能力线	P0 切片	P1 切片	P2 切片	P3/P4 切片
项目理解	展示语言、脚本、规则来源、执行位置	解释验证能力缺口和推荐检查	读取团队路径规则和受保护分支	关联需求、发布、事故和历史质量反馈
任务结果	短摘要：改动、已验证、未验证、下一步	风险原因、跳过后果和替代验证	PR 就绪度摘要和证据引用	发布/事故/复盘摘要
安全与沙箱	allow/ask/deny、执行位置、授权范围、沙箱降级原因	沙箱状态块、远程不可支持状态和替代路径	项目/团队安全策略、风险接受和审计	企业受管 sandbox、跨项目审计导出
风险与验证	未验证项进入任务摘要	行内弱提示、推荐检查、不可运行原因	配置化强制检查和审查强度	后验缺陷、CI、审查反馈回流
团队规则	规则来源只作为上下文展示	冲突或受管信号折叠提示	路径规则、CODEOWNERS、PR 策略按需生效	合规批准、发布就绪和组织审计
证据与图谱	记录最小事件和验证摘要	生成证据引用，不默认完整包	PR/团队场景投影证据包	交付物图谱、需求影响、事故回归
扩展与插件	预留 hook、事件、打点和候选契约	空实现、过期候选和幂等校验	工具复写契约和主动配置信任	插件适配主机原型、生态评测
指标与评测	建立速度、打断、安全和摘要覆盖基线	采样误升级、推荐检查和不可支持恢复	采样强制检查精度和 PR 采用	轨迹回放、策略 A/B、保留集

4. 阶段路线图

阶段	产品收益	纳入切片	必要技术前置	进入下一阶段条件
P-1	不作为用户发布；明确产品边界和技术跑道	策略契约、安全契约、事件契约、阶段用例和指标口径	LifecycleEvent、策略对象、配置优先级、测试桩、API 预设	能说明每个 P0/P1 切片服务的用户收益、降级解释和验收方法
P0	用户能低摩擦完成低风险任务，并看懂安全范围和未验证项	轻量项目理解、任务短摘要、安全确认、执行位置、主动配置发现、最小 QDP	项目扫描、基础安全决策、事件记录、摘要投影、关键回放用例	普通任务可完成；安全越界不静默；低风险任务不被重流程拖慢
P1	风险、远程和不可支持状态变得可理解，用户知道该补什么验证	弱提示、推荐检查、远程/沙箱降级、Kernel 扩展点 v0、证据引用摘要	风险分类器、提示降噪、sandbox capability 事件、扩展点空实现	高风险解释清楚；低风险仍快速；远程和不可支持状态有替代路径
P2	准备 PR 或进入团队规则时，用户获得可复制的协作摘要和规则说明	PR 就绪度、团队规则折叠说明、风险接受、主动配置信任、工具复写契约	规则来源合成、PR 投影、风险接受记录、证据引用状态	PR 摘要减少审查追问；团队规则来源可解释；强制项只在配置或确定性风险下出现
P3	受管项目的需求、开发、验证、审查和发布质量要求保持一致	路径级强策略、完整证据包投影、最小图谱、发布/事故链接、组织审计	图谱边状态、证据过期、受管配置、发布和事故事件	复杂项目可追溯；阻断/批准来源明确；快速路径仍保留
P4	用真实任务持续优化策略，淘汰无收益治理能力	轨迹回放、策略 A/B、评测卡、保留集、生态适配评估	回放环境、评测血缘、策略版本和成本采样	能用速度、质量、安全和成本联合评估治理策略

4.1 阶段详细治理矩阵

阶段	详细设计影响面	阶段结果	主要副作用和返工风险	质量管理方法	性能和成本看护
P-1	PRD、设计、事件信封、策略对象、安全边界、测试夹具、指标口径	技术跑道清晰；P0/P1 的收益、降级和验收方法可解释	契约过度设计导致后续实现被早期字段锁死；事件和策略对象未服务真实体验；测试夹具只覆盖理想路径	契约评审必须逐项映射 PRD、事件、用例和指标；新增字段要声明生产者、消费者和删除条件	不设用户路径预算；限制设计期事件和指标数量，避免 P0 一开始背负遥测膨胀
P0	项目打开、项目上下文条、任务短摘要、安全确认、远程执行位置、主动配置发现、最小 QDP	低风险任务能完成；用户看到已验证/未验证、安全范围、执行位置和下一步	默认体验被安全/摘要/扫描拖慢；项目扫描误判后形成强策略；安全确认过多；沙箱能力被夸大；主动配置发现误阻断普通任务	回放低风险任务、安全高敏动作、远程容器、主动配置发现；摘要必须包含未验证项；安全与质量事件分开审计	首次有用动作以 P0 基线为准；项目扫描分层、可取消、可延后；安全确认和摘要渲染不阻塞工具结果展示；QDP 只采最小事件
P1	风险提示、推荐检查、远程不可支持状态、沙箱降级说明、Kernel 扩展点、证据引用摘要	用户能理解风险和能力缺口，并知道补什么验证	风险提示泛化成噪音；推荐检查不可运行；远程缺口被本地验证掩盖；扩展点空实现被误认为可用插件能力；证据引用缺少新鲜度	中/高风险用例必须说明原因、证据、建议和跳过后果；推荐检查要有不可运行分支；扩展点候选不能写权威状态	风险分类和提示生成后台化；同类提示合并；扩展点有 deadline、epoch、幂等键；证据引用只保存摘要和引用
P2	PR 就绪度、团队规则来源、路径规则、风险接受、主动配置信任、工具复写契约	PR 或团队场景可获得可复制摘要和规则说明；普通任务不被团队流程打断	团队规则冲突导致误阻断；PR 摘要生成过重；风险接受被滥用；工具复写绕过安全；未信任主动配置产生假通过	PR/团队用例抽样验证规则来源、强制项、风险接受和撤销；风险接受必须记录范围、原因、操作者、期限；工具复写重新经过安全边界	PR 投影按需生成；证据引用增量更新；团队规则读取缓存并可解释失效；不创建默认强制 GitHub 检查
P3	路径级强策略、完整证据包投影、最小交付物图谱、需求/API/架构影响候选、发布/事故事件	受管项目的需求、实现、验证、审查、发布和风险接受强度一致	图谱误关联造成错误责任链；证据过期未失效；需求质量很高但开发/验证仍低保障；发布阻断来源不清；普通任务被图谱拖慢	受管路径抽样检查质量一致性；图谱边必须有来源、新鲜度和确认状态；发布就绪区分事实、候选和风险接受	图谱和证据只在 PR、发布、事故、合规场景显露；增量计算优先；过期重算后台化；普通任务保留短摘要
P4	轨迹回放、评测卡、策略 A/B、保留集、成本采样、生态适配评估	策略能用真实任务持续优化，低价值治理能力可下线	评测集污染；只优化强管控任务；A/B 影响用户信任；成本指标压倒质量；插件生态评估反向推动不成熟运行时提前接入	每个评测任务有血缘、泄漏状态和判定标准；A/B 只在可回滚策略上运行；后验缺陷、审查阻塞和用户反馈共同校准	回放和评测离线或低优先级执行；token、墙钟耗时、工具调用和提示次数进入评测卡；生态适配默认不改变内核权威状态

4.2 深度风险与返工预防

风险类型	触发方式	可能后果	预防和回退
默认体验变重	P0/P1 把证据包、图谱、深度审查或团队规则提前显露	低风险任务完成变慢，用户认为产品只适合强流程项目	默认只展示短摘要和必要安全确认；复杂能力按 PR、团队、发布、事故和合规触发；打断率和首次有用动作耗时超基线时降级
质量要求断层	需求或 PR 阶段要求很高，但开发过程中缺少风险提示、验证建议或未验证摘要	用户在末端突然被阻断，返工集中在 PR 或发布前	`quality.consistency.sampled` 抽样检查需求、开发、验证、审查、发布强度；受管路径从开发中就显示规则来源和验证缺口
风险误升级	风险分类把文档、小范围非核心改动或个人任务升级到团队治理	提示噪音、误阻断、用户绕过安全确认	风险等级只驱动建议和展示层级；阻断只能来自安全拒绝、组织策略、确定性失败或明确强制策略
风险漏报	小 diff 命中安全、权限、schema、远程、发布或主动配置	高风险变更通过轻量路径，后续缺陷或安全事件返工	路径、动作、主动配置和历史风险优先于 diff 行数；高风险低置信进入降级状态和推荐检查
沙箱误表述	只有用户确认或工作区快照，却展示为系统级隔离	用户误判安全边界，安全事故后需要重做授权模型	`allow_in_sandbox` 只在真实隔离可用时出现；沙箱等级组合、降级原因和残余风险写入 `security.decided`
远程/本地语义漂移	本地扫描、测试或路径判断被用于远程 SSH、容器或云端任务	无效验证、路径误写、权限扩大	所有工具和摘要显示执行位置、路径映射、端口/网络边界；本地能力不可替代远程能力，缺口必须给替代路径
事件和指标膨胀	P0 就采集完整日志、轨迹、证据和图谱字段	性能下降、隐私风险、事件迁移成本变高	P0 只采最小 QDP；新事件必须声明生产者、消费者、保留周期、隐私分级和删除条件
证据或图谱过期	新提交、策略变化、验证失败、审查范围变化后仍复用旧证据	PR、发布或事故复盘引用错误事实	证据和图谱边带新鲜度、来源和确认状态；过期后只能作为历史引用，不能作为通过依据
团队规则冲突	AGENTS、CODEOWNERS、CI、工具配置和组织策略给出不同要求	误阻断、重复检查、规则不可解释	配置优先级固定；冲突显示来源和作用域；不能静默选择高风险路径
插件和工具复写越权	外部插件、OpenCode 适配层或工具复写候选直接影响权威状态	执行链不可信，后续需要重构 Kernel/Host 边界	P0/P1 只保留 Kernel 扩展点和候选契约；候选不能写通过、失败、阻断、审计或授权状态
性能优化牺牲安全	为了减少弹窗或延迟，把安全确认合并到质量覆盖或默认允许	安全边界被质量流程稀释	安全决策独立常驻；降噪只能通过范围限制、白名单、真实沙箱和一次性授权实现
评测过拟合	策略只针对固定任务集或强治理样本优化	普通项目体验变差，真实任务收益下降	评测卡记录血缘和污染状态；低风险、远程、安全、PR、受管路径都必须保留样本

5. P-1：产品和架构跑道

P-1 是内部跑道，不应作为用户可见“新能力”发布。它的价值是避免后续阶段为了补契约反复返工。

交付件	内容	验收方式
阶段收益切片表	将每条能力线拆成 P0-P4 可交付用户收益、技术前置和延期边界	每个切片都能对应 PRD、设计模块、事件和测试方法
配置化策略契约	内部策略画像、原因、展示层级、检查、审查策略、覆盖选项	能解释每次提示、升级、阻断来源
体验投影契约	将内部策略画像映射为用户可见状态、弱提示、确认、设置和日志	用户无需学习内部模式也能理解当前状态
产品需求映射	将 PRD 中目标、画像、体验路径和功能需求映射到策略对象、界面状态、事件和验收方法	能说明能力如何服务不同人群和任务阶段
关键用例清单	低风险开发、安全确认、远程上下文、PR 就绪、受管路径、主动配置信任的回放用例	每个 PRD-18 用例都有入口、默认状态、体验收益和验证方法
安全边界契约	权限、执行位置、沙箱等级组合、网络、凭据、主动配置信任、应急放行	安全决策不依赖门禁或质量策略
能力/效果模型契约	tool、MCP、skills、插件、hook 和内置能力统一声明能力、目标、数据类别、信任来源和副作用候选	新扩展不需要修改策略核心即可进入安全判定；未声明能力默认受限
执行与沙箱矩阵	本地、远程、ACP、MCP、MiniApp/前端、插件适配主机、浏览器/桌面、云端任务的执行位置、隔离等级、降级原因和用户选项	`allow_in_sandbox` 只在真实隔离可用时出现
Kernel 扩展点契约	生命周期 hook、事件信封、打点、工具复写候选、插件效果候选、deadline、epoch 和幂等键	未来适配器可接入，空实现不影响默认任务
最小事件注册表	`project.opened`、`task.started`、`policy.decided`、`security.decided`、`verification.completed`、`task.completed`、`stage.outcome.evaluated`、`quality.consistency.sampled`、`performance.budget.evaluated`	快速路径、安全提示、任务摘要、阶段收益、质量一致性和性能回退可追踪
产品指标规格	首次有用动作耗时、打断率、阶段收益达成率、质量一致性缺口率、应急放行率	阶段验收不只看技术完成度

退出条件：可以描述 P0/P1 每个切片的用户收益、技术前置、降级解释和回放方法；每个高权限动作都有 allow/ask/deny/应急放行路径。

6. P0：可解释的轻量开发闭环

6.1 阶段目标

让用户打开任意外部项目后，能快速完成一次低风险开发任务，并在不理解内部治理术语的情况下获得简洁结果、安全范围和未验证项说明。

6.2 交付件

用户可见收益	必要实现	明确不做或延期
项目上下文条能说明项目、执行位置、主要入口和规则来源	轻量扫描语言、包管理器、常用脚本、git 状态、README/AGENTS/CONTRIBUTING/CI 入口	不完整建模模块边界，不用推断结果形成强制策略
任务结束有短摘要	记录改动、已运行命令、未验证项、下一步建议和信心摘要	不默认展示完整证据包、图谱或 PR 门禁
安全动作有低噪音确认	工作区写、shell、网络、凭据、删除、跨根目录写入基础决策，记录执行位置、沙箱等级组合和降级原因	不声称具备未实现的运行时沙箱
远程或云端执行位置可见	识别本地、SSH、容器、远程工作区、云端异步任务和不可用本地能力	不把本地能力投影为远程能力
主动配置默认安全	发现 hook、plugin、MCP、自定义工具、工具复写和智能体规则，默认未信任且不执行	不执行外部插件运行时
低风险任务也有一致质量说明	低风险任务摘要必须包含已验证、未验证、跳过原因和建议补证路径	不要求深度审查、强制检查或完整需求分析
阶段数据可采样	记录任务、工具、验证、安全决策、用户覆盖、摘要生成、阶段收益和质量一致性抽样事件	不用指标阻塞 P0 用户任务

6.3 验收成果

质量保障要求较低的探索性改动可以快速获得可用结果和短摘要。
常规项目可以在不配置 .bitfun 的情况下识别主要开发命令。
用户默认不需要理解内部策略模式。
安全敏感动作会提示原因、范围、执行位置和可选隔离路径。
权限确认、快照/worktree 隔离和运行时沙箱在提示中分开表达；没有真实隔离时不展示为沙箱允许。
远程项目能展示执行主机、工作区根、权限边界和不可用能力。
用户可以一次性放行低/中风险越界，但不能静默持久化。
低风险任务虽然不强制检查，但仍保留已验证/未验证项、跳过原因和下一步。
低风险任务、安全确认和远程容器用例可回放，布局、文案、交互和用户收益符合 PRD-18。

6.4 过程风险

风险	处置
为了安全把 P0 做重	优先用范围限制、沙箱、白名单和短确认降噪
沙箱能力被夸大	`security.decided` 必须记录实际沙箱等级组合和降级原因，文案禁止把权限确认描述成系统级隔离
项目理解不准	推断结论只用于提示，不用于强策略
低风险任务质量解释不足	任务摘要必须列出已验证、未验证和跳过原因
远程上下文不清	先提示执行位置和能力缺口，不自动扩大权限

7. P1：风险和远程状态可理解

7.1 阶段目标

当任务出现风险、远程环境差异或验证缺口时，BitFun 解释为什么需要额外动作，并给出可执行的检查、替代验证或降级路径。

7.2 交付件

用户可见收益	必要实现	明确不做或延期
中风险动作有行内弱提示	路径、模块、操作、历史信号和安全敏感标签进入风险提示 v0	不默认弹窗，不默认深度审查
推荐检查可执行或可解释	推荐验证命令、替代验证、不可运行原因和跳过后果	不把推荐检查等同阻断
远程不可支持状态可恢复	私有依赖、本地二进制、端口、凭据或权限不可用时给替代路径	不假装本地检查覆盖远程环境
沙箱降级可见	本地/远程/ACP/MCP/插件/浏览器/云端执行面的状态块、降级说明和替代路径	不把权限确认包装成沙箱
扩展点可预留但不干扰	稳定事件、hook 注册点、打点、工具复写候选契约和空实现	不执行 OpenCode 插件，不让候选写权威状态
证据引用按需出现	只生成摘要和证据引用，服务任务摘要和后续 PR	不默认生成完整证据包

7.3 验收成果

低风险改动不触发深度审查。
高风险或中风险改动能解释升级原因、建议检查和跳过后果。
同类提示不会在同一任务中反复弹窗。
CI、私有环境或远程能力不可运行时输出替代建议、信心影响和后续补证路径。
扩展点无适配器、空实现或返回过期候选时，不影响内核权威状态。
风险提示、推荐检查、沙箱降级和远程不可支持用例可回放。

8. P2：PR 协作和团队规则按需显露

8.1 阶段目标

用户准备 PR、分享变更或命中团队规则时，BitFun 提供可复制的协作摘要、规则来源和风险接受入口，而不影响普通任务中间过程。

8.2 交付件

用户可见收益	必要实现	明确不做或延期
PR 就绪度可复制	变更、验证、未验证项、风险、证据引用和复制到 PR 的 Markdown 块	不默认创建强制 GitHub 检查
团队规则来源可解释	AGENTS、CONTRIBUTING、CODEOWNERS、CI、`.github/instructions`、`.coderabbit.yaml`、`.gitlab/duo` 读取和来源展示	不让冲突规则静默生效
受管路径有折叠说明	路径规则、审查强度、强制检查和冲突状态按需展示	不把所有团队配置变成默认首屏
风险接受可追踪	操作者、原因、范围、残余风险、过期时间和撤销入口	不允许绕过安全拒绝和组织拒绝策略
主动配置可先审后用	hook、plugin、MCP、自定义工具和工具复写记录来源、hash、权限和信任状态	不执行未信任主动配置
工具复写有契约	定义内核工具表、复写候选、权限校验和撤销入口	外部插件运行时接入延后

8.3 验收成果

PR 摘要减少审查人追问，但不默认阻塞。
团队能用仓库配置统一体验，个人一次性任务仍使用个人默认值。
路径规则冲突能显示并要求确认。
强制要求或阻断有明确来源，不由模型单独触发。
工具复写契约不会跨项目生效，也不会绕过文件、shell、网络和凭据策略。
PR 就绪、受管路径、风险接受和主动配置信任用例可回放。

9. P3：受管项目一致治理

9.1 阶段目标

为高质量要求、受管路径、发布和事故相关任务提供一致治理。需求、开发、验证、审查、发布和风险接受不应出现明显强弱断层。

9.2 交付件

用户可见收益	必要实现	明确不做或延期
受管项目质量要求一致	路径级强策略、审查强度、强制检查、风险接受和发布要求共同生效	不把单个需求文档质量当成全部质量保证
完整证据包按场景投影	团队、发布、事故或合规场景生成可追踪证据包	普通任务仍只看摘要
最小交付物图谱可解释	`diff -> verification -> evidence_pack -> PR`，并支持过期状态	不把未确认图谱边当成事实
需求/API/架构影响候选可确认	高风险需求、API、权限、数据和架构变更给影响候选和人工确认	不由模型直接写入权威影响事实
发布和事故回流	发布就绪度、回滚风险、事故到回归候选和规则更新	不要求所有项目一次性启用

9.3 验收成果

普通任务不需要看到图谱或完整证据包。
复杂 PR 可以解释证据和关系来源。
发布就绪度能说明可发布、不可发布或已接受风险。
事故能转成回归候选或规则更新。
受管任务抽样时，需求、实现、验证、审查和发布要求强度一致。

10. P4：生命周期追溯与策略优化

10.1 阶段目标

用真实任务和产品指标优化智能体行为、治理策略和质量治理，避免只优化基准测试或只优化强管控。

10.2 交付件

交付件	内容
轨迹回放	回放任务、命令、验证、提示、覆盖和安全决策
评测卡	任务集、判定标准、模型/上下文/工具/策略版本、成本、安全事件
治理策略 A/B	比较提示频率、误升级、成功率、用户放行和质量结果
保留集	防泄漏任务集和真实项目回归
策略校准	合入后缺陷、审查阻塞项、CI 失败和用户反馈回流
生态适配评估	OpenCode 等插件系统作为适配层评估，不改变内核权威状态

10.3 验收成果

能证明新策略没有让普通任务变慢。
能证明安全提示减少盲目确认。
能证明高风险场景质量更稳定。
能发现哪些门禁、审查、图谱或证据能力没有产品价值，应下线或降级。

11. 阶段质量一致性检查

每个阶段退出前必须抽样检查同一风险等级下的体验强度是否一致。

场景	需求/意图	开发过程	验证	审查/分享	必须避免
低风险个人任务	简短任务目标即可	低干预、必要安全确认	可选检查，摘要记录未验证项	不默认 PR 门禁	要求完整需求说明却不说明开发未验证风险
中风险变更	说明风险来源和影响范围	行内弱提示和推荐检查	推荐检查或替代验证	分享/PR 时展示未验证项	风险提示很多但没有下一步
受管路径	读取团队规则和路径要求	按规则提示或阻断	强制检查有来源	PR 就绪度和风险接受	只在 PR 阶段突然加重流程
安全高敏动作	展示命令、范围、执行位置和后果	安全边界独立确认	记录授权、沙箱和降级	审计和撤销入口	把质量覆盖当成安全授权
远程/云端任务	标注执行域和不可用能力	不假设本地能力可用	给替代验证或补证路径	摘要说明环境差异	本地验证结果冒充远程验证

11.1 阶段发布闸口

闸口	检查项	不满足时的处理
用户收益	阶段至少有一个可回放用户场景达到预期体验结果，并能说明未完成边界	不发布为阶段完成；只能作为技术跑道或实验能力记录
质量一致性	同一风险等级下，需求、开发、验证、审查和发布强度没有明显断层	降低阶段范围，或补齐开发中提示、验证建议、风险接受记录
风险副作用	新增提示、确认、规则、证据或图谱没有引入明显误升级、误阻断、隐私扩大或安全误表述	默认关闭该切片，改为设置项、实验开关或后台记录
性能看护	首次有用动作、用户打断率、后台扫描耗时、事件载荷和 token/工具成本没有超过阶段预算	延后后台分析、降低采样、只保留摘要，或回滚高成本切片
降级和回退	每个新切片都有不可用状态、降级文案、替代路径和关闭方式	不允许进入默认路径
数据和隐私	新事件、证据、日志、评测轨迹都声明隐私分级、保留周期和导出策略	不采集原始数据，只保留脱敏摘要或引用

11.2 性能预算口径

预算项	口径	回退策略
首次有用动作	P0 建立基线；P1 以后默认路径不得无解释高于上一阶段基线	延后项目深扫、证据生成、图谱更新和评测采样
项目扫描	轻量扫描先返回入口、脚本、规则来源和执行位置；完整建模后台化	取消或降级为“未知区域”，不阻塞任务开始
提示与确认	同一任务、同一原因、同一范围只出现一次强提示；低价值提示合并到摘要	合并、延后、折叠或进入任务结束摘要
证据和图谱	只在 PR、团队、发布、事故或合规场景计算完整投影	默认只保留摘要和引用，过期重算后台执行
QDP 事件	新事件字段必须服务用户收益、风险解释、质量一致性或性能看护	删除字段、降采样、缩短保留周期或只保存脱敏引用
模型和工具成本	深度审查、影响分析、评测回放、插件适配评估默认不进入低风险路径	改为用户触发、团队配置触发或离线任务

12. 看护指标

详细口径见 metrics-spec.md。P0/P1 必须优先看这些指标：

首次有用动作耗时。
阶段收益达成率。
质量一致性缺口率。
阶段性能回退率。
事件载荷预算命中率。
用户打断率。
弹窗触发率。
重复提示抑制率。
安全提示接受/忽略率。
应急放行率和范围。
沙箱降级率和降级原因分布。
误升级率。
低风险任务完成率。
推荐检查执行率。
PR 就绪度采用率。
远程不可支持状态恢复率。
跨入口语义一致率。
强制检查精度。
合入后缺陷 / 审查阻塞项反馈。

13. 发布和 PR 策略

每次阶段发布必须说明用户可见收益、必要技术前置、延期边界和降级解释。
P0/P1 默认不创建强制 GitHub 检查；优先本地摘要和 PR 文本块。
团队治理开启后，才将就绪度或门禁投影到 PR 状态/评论。
阻断只允许来自安全边界、组织策略、确定性失败或明确强制要求策略。
每次发布 PR 文档必须说明默认体验是否变重，以及如何避免普通项目被重流程影响。

14. 关键里程碑

里程碑	判定标准
M0：收益切片清晰	每条能力线都有用户收益、技术前置、延期边界和验收方法
M1：轻量闭环可用	普通项目无需配置即可完成有用开发任务，并看懂已验证/未验证项
M2：风险状态可解释	风险、远程、沙箱和不可支持状态有原因、替代路径和低噪音提示
M3：协作摘要可复用	PR/团队场景可复用就绪度、规则来源、风险接受和证据引用
M4：受管质量一致	需求、开发、验证、审查、发布和风险接受强度一致
M5：复杂项目可追溯	证据包/图谱支撑 PR/发布/事故，快速路径保留轻量摘要
M6：策略可评估	治理策略能用效率、质量、安全和成本联合衡量

15. 完成标准

这组能力完成时，BitFun 应表现为：

普通开发像轻快助手，且一直说明已验证和未验证内容。
高风险动作像可靠安全执行环境，且不把授权误称为沙箱。
团队项目像可配置协作系统，且规则来源和强制项可解释。
复杂项目像可追溯工程平台，且图谱和证据按场景显露。
所有复杂技术都服务于明确体验：更快完成任务、更准识别风险、更清楚解释信心或更可靠复盘。