V0.1 — ANIMA 五层闭环在本地跑通(mock skills)

这是研究原型时期的第一次发版,在 human-brain-interface-demo 仓里诞生。目标很直接:端到端证明 ANIMA 认知框架能驱动一个意图-行动闭环,但暂时不上物理引擎——机器人动作用 mock skill 替代,先把上层认知栈完整跑通。

选的入场场景是「我想喝水」——足够日常、足够典型,覆盖感知 / 规划 / 执行 / 评估所有层。

核心事实:L0 是语言,不是神经解码

这个决策在 v0.1 就锁定了:L0 Signal 层不伪装解码 BCI 神经信号。实际输入就是文本 / 语音,通过 LLM-as-Parser(强制 tool-calling)产出结构化 IntentToken

UI 里仍保留一条装饰性的 256 通道波形动画(text-hash 做种子),但界面上明确标注 "decorative only — intent derived from text via LLM parser"。这条诚信线从 v0.1 一直贯穿到今天的 v0.4。

五层栈全部落地

  • L0 Input:文本特征抽取 + 装饰性波形
  • L1 Intent Parser:LLM 强制 tool-call → IntentToken(35 词词表)
  • L2 Plannerpy_trees Sequence 编排
  • L3 Skill:mock 技能节点占位
  • L4 Actuator:mock 执行(不挂物理引擎)
  • L5 Assessment:五因素(ITA / MQA / SQA / GOA / PEA)事件触发评估,PEA 写入 pea_log.jsonl 做长期学习

整套认知栈通过单条 WebSocket 把所有层级事件推到前端,驱动动画。

技术骨架

后端:FastAPI,uv + Python 3.12,:8765;DeepSeek 作默认 LLM 提供方(100% OpenAI SDK 兼容,为后续切换留口);Pydantic 模型 TaskSpec / IntentToken / FiveFactors 固化结构。

前端:Next.js 16 + Tailwind + zustand + ReactFlow,:3000。7 个关键组件串起 L0–L5 可视化:

  • LayerStack(左栏层级指示)
  • IntentInput / SignalWaveform / TaskSpecPanel / IntentTokenStream(中栏意图链)
  • BehaviorTreeFlow(行为树可视化)
  • FiveFactorPanel(右栏评估仪表)

验收

本地双进程(uv run uvicorn + npm run dev),输入"我想喝水"后:

  • L0 → L5 依次高亮
  • TaskSpec 产出 DRINK_WATER,置信度 > 0.8
  • 行为树五节点从 sky 状态转为 green
  • 五因素面板实时更新
  • PEA 事件落盘

这一步证明了 ANIMA 的认知栈在纯语言输入下能跑通完整闭环,为 v0.2 接入 MuJoCo 仿真打下基础。