OpenSquilla — 高效 Token 的本地 AI Agent 运行时
项目简介
OpenSquilla 是一个Token 高效的微内核 AI Agent 运行时,支持 CLI、Web UI 和各类消息通道。它用本地模型路由器(SquillaRouter)将每个对话轮次发送给「最便宜但能胜任当前任务」的模型,同时配备持久化记忆、分层沙箱、内置搜索和本地 Embedding。
当前版本 0.3.1,Apache-2.0 开源,核心特性:同一套运行时在所有入口(CLI、Web UI、消息平台)共享相同的行为——工具调度、重试、决策日志完全一致。
项目地址:https://github.com/opensquilla/opensquilla
官网:https://opensquilla.ai
核心特性一览
| 特性 | 说明 |
|---|---|
| SquillaRouter | 本地 LightGBM + ONNX 分类器,对每个 Turn 打分后路由到 T0~T3 四个层级中最便宜的模型。分类在本地运行,Prompt 不会离开机器去外部决策 |
| 自适应推理 | 仅对路由器判定为复杂的问题请求扩展推理,系统提示词也随任务复杂度动态调整 |
| 20+ LLM 提供商 | OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、DashScope/Qwen、Moonshot、Mistral、Groq、Zhipu、SiliconFlow、vLLM、LM Studio 等,支持主+备双提供商 |
| 按需 Skills 与 MCP | 15 个内置 Skills(编码、GitHub、cron、PPTX/DOCX/XLSX/PDF、摘要、tmux、天气等)只在需要时加载;也是 MCP 客户端,可作为 MCP 服务端运行 |
| 持久化本地记忆 | MEMORY.md + 日期 Markdown 笔记,SQLite 全文搜索 + sqlite-vec 语义召回;Embedding 在本地通过 ONNX 运行,或切换到 OpenAI/Ollama |
| 分层安全沙箱 | 三种策略层级(Standard / Strict / Locked);Linux 用 Bubblewrap 隔离代码执行;macOS Seatbelt 暂时只读,Windows 暂无沙箱后端 |
| 内置工具集 | 文件读写编辑、Shell 和后台进程、Git、Web 搜索/抓取(防 SSRF)、电子表格/PPTX/PDF 生成、图片生成、语音合成等 |
| 统一网关 | Starlette ASGI 服务器,默认 127.0.0.1:18791,内置 WebSocket RPC 和控制台;Web UI、CLI、Slack/Telegram/Discord/飞书/钉钉/企微/QQ/Matrix 等消息通道共享一个 TurnRunner |
| 持久化会话与子 Agent | SQLite 持久化存储会话、 transcript、replay;Agent 可生成有限深度的子 Agent;内置 cron 解析器支持定时任务 |
| 操作员控制 | 敏感工具调用可暂停等待人工审批;每轮/每会话 token 和成本实时统计 |
性能对比
在 PinchBench 1.2.1(25 个任务)上的测试结果:
| Agent | 基础模型 | 平均得分 | 输入 Token | 输出 Token | 总成本 |
|---|---|---|---|---|---|
| OpenSquilla | 模型路由器(Opus 4.7、GLM 5.1、DS4 Flash) | 0.9251 | 1,721,328 | 61,475 | $0.688 |
| OpenClaw | Claude Opus 4.7 | 0.9255 | 3,066,243 | 50,890 | $6.233 |
两者得分几乎相同(0.9255 vs 0.9251),但 OpenSquilla 的成本仅为 OpenClaw 的 11%,输入 Token 节省了约 44%。
安装方式
推荐:Quick terminal install(跨平台)
# 1. 安装 uv(如果没有)
curl -LsSf https://astral.sh/uv/install.sh | sh
. "$HOME/.local/bin/env"
# 2. 安装 OpenSquilla(含 SquillaRouter)
uv tool install --python 3.12 \
"opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"
# 3. 配置并运行
opensquilla onboard
opensquilla gateway run
Windows 便携版(免 Python)
- 下载 OpenSquilla-windows-x64-portable.zip
- 解压后右键
Start OpenSquilla.cmd→ 以管理员身份运行 - 完成首次设置后访问 http://127.0.0.1:18791/control/
从源码安装
git lfs install
git clone https://github.com/opensquilla/opensquilla.git
cd opensquilla
git lfs pull --include="src/opensquilla/squilla_router/models/**"
bash scripts/install_source.sh # macOS / Linux
powershell -ExecutionPolicy Bypass -File ./scripts/install_source.ps1 # Windows
核心设计:SquillaRouter
SquillaRouter 是 OpenSquilla 的核心竞争力。它是一个本地运行的 LightGBM + ONNX 分类器,从四个层级中选择最适合的模型:
| 层级 | 典型模型 | 适用场景 |
|---|---|---|
| T0 | GPT-4.1 / Claude Opus | 复杂推理、多步规划、高难度编码 |
| T1 | GPT-4o / Gemini 2.5 | 中等复杂任务 |
| T2 | GPT-4o-mini / Claude 3.5 Haiku | 简单推理、摘要 |
| T3 | DeepSeek Flash / Qwen Turbo | 极简单任务、闲聊 |
路由器综合考量文本长度、语言类型、代码占比、关键词、语义向量等多个维度,在本地完成决策——Prompt 数据不会发送到外部分类服务。
快速使用
opensquilla gateway start --json # 后台运行网关
opensquilla chat # 交互式终端聊天
opensquilla agent -m "总结这个代码库并告诉我该测什么" # 单次自动化
# 查看状态
opensquilla doctor # 诊断 readiness
opensquilla cost # 成本统计
opensquilla sessions list # 历史会话
支持的消息通道
| 通道 | 连接模式 | 说明 |
|---|---|---|
| 飞书 | WebSocket / Webhook | 默认 WebSocket,不需要公网地址 |
| Telegram | Polling / Webhook | 默认 Polling |
| Discord | — | 支持 |
| Slack | Socket Mode / Webhook | Socket Mode 不需要公网地址 |
| 钉钉 | — | — |
| 企业微信 | Webhook | 需要公网可达 URL |
| — | — | |
| Matrix | E2E(可选) | 需要 libolm |
与 OpenClaw / Hermes Agent 的迁移
OpenSquilla 支持从已有的 Agent 数据目录迁移:
# 预览迁移报告
opensquilla migrate openclaw --json
opensquilla migrate hermes --json
# 应用迁移
opensquilla migrate openclaw --apply
opensquilla migrate hermes --apply
一句话总结
OpenSquilla = 本地路由器(省 Token)+ 统一运行时(CLI/Web UI/消息通道同款)+ 按需 Skills + 持久化记忆 + 分层沙箱。
在保持与 OpenClaw 几乎相同得分的前提下,成本从 $6.233 降到 $0.688——适合需要长期运行、注重成本效率的个人用户或小团队。
项目地址:https://github.com/opensquilla/opensquilla
官方文档:https://opensquilla.ai
当前版本:v0.3.1(2026)