AI · 折腾
TuttiKit
类 Claude / Codex 的对话式多 Agent 系统
git clone 拉下来配一个 API Key,五分钟跑通。模型可换 (Anthropic / OpenAI / DeepSeek / Mock),Agent 自己决定调啥工具、委派给谁。整套代码 ~4.8k 行 TypeScript,看一遍能看明白。
核心能力
多 Agent 协作
Conductor 持完整历史 + Researcher / Coder / Reviewer 三个 sub-agent,以 "agent as tool" 模式互相调用,ReAct 自动多步推理
模型随便换
Anthropic / OpenAI / DeepSeek / Mock,一行 .env 切换。无 Key 自动 fallback 到 Mock,先跑通再花钱
多模态附件
图片 OCR (tesseract 中英双语) + PDF 抽取 (pdf-parse,50 页毫秒级)。不支持原生多模态的模型自动收文本
Skills 系统
完全兼容 Claude Code skills:.claude/skills/<name>/SKILL.md 直接能用,frontmatter 解析,按需 find / invoke
MCP 协议
stdio + HTTP/SSE 两种传输,.mcp.json 配置即接入。社区现成的 MCP server 直接拿来用,失败 server 跳过不阻断启动
跨设备同步
后端全局 SSE 事件总线,PC ↔ 手机消息 / 会话 / 删除实时双向同步;iOS 切回前台主动重连,30s 心跳
本地持久化
会话 / Trace / 长期记忆全落本地 JSON,没有 Postgres、Redis、S3,零运维。重启不丢
可观测
每次 turn 完整 Trace,LLM 调用 / 工具调用 / sub-agent 调用层层嵌套落盘,踩坑时查得到根因
怎么工作的
节点数量与内容完全由 LLM 实时决定。简单问答 1 步,调研+落地+审查 3 层嵌套,框架不预设阶段。
用户:「调研下 pgvector,写到 ./data/notes.md,再帮我审一遍」
│
▼
┌──────────────────────────────────────────────────┐
│ 🎩 Conductor (主对话 Agent · 持完整历史) │
│ │
│ 每一步由 LLM 决定: │
│ ├─ 直接回答 (闲聊 / 概念) │
│ ├─ 调工具 (calculator / web_search ...) │
│ └─ 委派子 Agent: │
│ ├─ delegate_to_researcher → 🔍 调研 │
│ ├─ delegate_to_coder → ✍️ 写文件 │
│ └─ delegate_to_reviewer → 🧑⚖️ 审查 │
│ │
│ 子 Agent 内部又是一个 ReAct 循环,调自己的工具集 │
└──────────────────────────────────────────────────┘
│
▼
最终回复 (流式 token · 可中断)界面一览
多 Agent 拓扑
Conductor 持完整历史,按需委派 Researcher / Coder / Reviewer。Agent as tool,嵌套调用零特殊处理
多模态输入
图片 OCR + PDF 抽取,在上传时同步完成。纯文本模型也能 "看见"
跨设备实时同步
全局 SSE 事件总线,PC 发完一句话,手机 1-3 秒内同步;扫码即进,无需登录
嵌套 Trace 可观测
每次 turn 完整落盘:LLM 调用 / 工具调用 / sub-agent 调用层层嵌套
技术栈
- 01
Prompt / Agent 模板
代码评审 · 调研 · 翻译 · 改写
- 02
学习笔记
论文阅读 · 模型对比 · 调用心得