AI · 

记录我在 AI 方向上的实践与思考
FEATURED PROJECT

TuttiKit

类 Claude / Codex 的对话式多 Agent 系统

git clone 拉下来配一个 API Key,五分钟跑通。模型可换 (Anthropic / OpenAI / DeepSeek / Mock),Agent 自己决定调啥工具、委派给谁。整套代码 ~4.8k 行 TypeScript,看一遍能看明白。

TS Strict·全栈类型84 Tests·全绿Multi-Agent·Conductor + 3 subMCP·stdio + SSELicense·MIT
源码 / GitHub
Capabilities

核心能力

01

多 Agent 协作

Conductor 持完整历史 + Researcher / Coder / Reviewer 三个 sub-agent,以 "agent as tool" 模式互相调用,ReAct 自动多步推理

02

模型随便换

Anthropic / OpenAI / DeepSeek / Mock,一行 .env 切换。无 Key 自动 fallback 到 Mock,先跑通再花钱

03

多模态附件

图片 OCR (tesseract 中英双语) + PDF 抽取 (pdf-parse,50 页毫秒级)。不支持原生多模态的模型自动收文本

04

Skills 系统

完全兼容 Claude Code skills:.claude/skills/<name>/SKILL.md 直接能用,frontmatter 解析,按需 find / invoke

05

MCP 协议

stdio + HTTP/SSE 两种传输,.mcp.json 配置即接入。社区现成的 MCP server 直接拿来用,失败 server 跳过不阻断启动

06

跨设备同步

后端全局 SSE 事件总线,PC ↔ 手机消息 / 会话 / 删除实时双向同步;iOS 切回前台主动重连,30s 心跳

07

本地持久化

会话 / Trace / 长期记忆全落本地 JSON,没有 Postgres、Redis、S3,零运维。重启不丢

08

可观测

每次 turn 完整 Trace,LLM 调用 / 工具调用 / sub-agent 调用层层嵌套落盘,踩坑时查得到根因

Architecture

怎么工作的

节点数量与内容完全由 LLM 实时决定。简单问答 1 步,调研+落地+审查 3 层嵌套,框架不预设阶段。

用户:「调研下 pgvector,写到 ./data/notes.md,再帮我审一遍」
            │
            ▼
┌──────────────────────────────────────────────────┐
│  🎩 Conductor  (主对话 Agent · 持完整历史)        │
│                                                  │
│  每一步由 LLM 决定:                              │
│   ├─ 直接回答     (闲聊 / 概念)                  │
│   ├─ 调工具      (calculator / web_search ...)   │
│   └─ 委派子 Agent:                               │
│       ├─ delegate_to_researcher  → 🔍 调研       │
│       ├─ delegate_to_coder       → ✍️  写文件     │
│       └─ delegate_to_reviewer    → 🧑‍⚖️ 审查      │
│                                                  │
│  子 Agent 内部又是一个 ReAct 循环,调自己的工具集 │
└──────────────────────────────────────────────────┘
            │
            ▼
        最终回复 (流式 token · 可中断)
Screenshots

界面一览

多 Agent 拓扑

Conductor 持完整历史,按需委派 Researcher / Coder / Reviewer。Agent as tool,嵌套调用零特殊处理

多模态输入

图片 OCR + PDF 抽取,在上传时同步完成。纯文本模型也能 "看见"

跨设备实时同步

全局 SSE 事件总线,PC 发完一句话,手机 1-3 秒内同步;扫码即进,无需登录

嵌套 Trace 可观测

每次 turn 完整落盘:LLM 调用 / 工具调用 / sub-agent 调用层层嵌套

Stack

技术栈

TypeScript (strict)Next.js 15ExpressVercel AI SDKpnpm monorepoTailwindSSEtesseract.jspdf-parseMCP SDK
More to come
  • 01

    Prompt / Agent 模板

    代码评审 · 调研 · 翻译 · 改写

  • 02

    学习笔记

    论文阅读 · 模型对比 · 调用心得

回到文章