V0.1 — ANIMA 五层闭环在本地跑通(mock skills)
这是研究原型时期的第一次发版,在 human-brain-interface-demo 仓里诞生。目标很直接:端到端证明 ANIMA 认知框架能驱动一个意图-行动闭环,但暂时不上物理引擎——机器人动作用 mock skill 替代,先把上层认知栈完整跑通。
选的入场场景是「我想喝水」——足够日常、足够典型,覆盖感知 / 规划 / 执行 / 评估所有层。
核心事实:L0 是语言,不是神经解码
这个决策在 v0.1 就锁定了:L0 Signal 层不伪装解码 BCI 神经信号。实际输入就是文本 / 语音,通过 LLM-as-Parser(强制 tool-calling)产出结构化 IntentToken。
UI 里仍保留一条装饰性的 256 通道波形动画(text-hash 做种子),但界面上明确标注 "decorative only — intent derived from text via LLM parser"。这条诚信线从 v0.1 一直贯穿到今天的 v0.4。
五层栈全部落地
- L0 Input:文本特征抽取 + 装饰性波形
- L1 Intent Parser:LLM 强制 tool-call →
IntentToken(35 词词表) - L2 Planner:
py_treesSequence 编排 - L3 Skill:mock 技能节点占位
- L4 Actuator:mock 执行(不挂物理引擎)
- L5 Assessment:五因素(ITA / MQA / SQA / GOA / PEA)事件触发评估,PEA 写入
pea_log.jsonl做长期学习
整套认知栈通过单条 WebSocket 把所有层级事件推到前端,驱动动画。
技术骨架
后端:FastAPI,uv + Python 3.12,:8765;DeepSeek 作默认 LLM 提供方(100% OpenAI SDK 兼容,为后续切换留口);Pydantic 模型 TaskSpec / IntentToken / FiveFactors 固化结构。
前端:Next.js 16 + Tailwind + zustand + ReactFlow,:3000。7 个关键组件串起 L0–L5 可视化:
LayerStack(左栏层级指示)IntentInput/SignalWaveform/TaskSpecPanel/IntentTokenStream(中栏意图链)BehaviorTreeFlow(行为树可视化)FiveFactorPanel(右栏评估仪表)
验收
本地双进程(uv run uvicorn + npm run dev),输入"我想喝水"后:
- L0 → L5 依次高亮
- TaskSpec 产出
DRINK_WATER,置信度 > 0.8 - 行为树五节点从 sky 状态转为 green
- 五因素面板实时更新
- PEA 事件落盘
这一步证明了 ANIMA 的认知栈在纯语言输入下能跑通完整闭环,为 v0.2 接入 MuJoCo 仿真打下基础。