OpenSquilla — 高效 Token 的本地 AI Agent 运行时


OpenSquilla — 高效 Token 的本地 AI Agent 运行时

项目简介

OpenSquilla 是一个Token 高效的微内核 AI Agent 运行时,支持 CLI、Web UI 和各类消息通道。它用本地模型路由器(SquillaRouter)将每个对话轮次发送给「最便宜但能胜任当前任务」的模型,同时配备持久化记忆、分层沙箱、内置搜索和本地 Embedding。

当前版本 0.3.1,Apache-2.0 开源,核心特性:同一套运行时在所有入口(CLI、Web UI、消息平台)共享相同的行为——工具调度、重试、决策日志完全一致。

项目地址:https://github.com/opensquilla/opensquilla
官网:https://opensquilla.ai

核心特性一览

特性 说明
SquillaRouter 本地 LightGBM + ONNX 分类器,对每个 Turn 打分后路由到 T0~T3 四个层级中最便宜的模型。分类在本地运行,Prompt 不会离开机器去外部决策
自适应推理 仅对路由器判定为复杂的问题请求扩展推理,系统提示词也随任务复杂度动态调整
20+ LLM 提供商 OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、DashScope/Qwen、Moonshot、Mistral、Groq、Zhipu、SiliconFlow、vLLM、LM Studio 等,支持主+备双提供商
按需 Skills 与 MCP 15 个内置 Skills(编码、GitHub、cron、PPTX/DOCX/XLSX/PDF、摘要、tmux、天气等)只在需要时加载;也是 MCP 客户端,可作为 MCP 服务端运行
持久化本地记忆 MEMORY.md + 日期 Markdown 笔记,SQLite 全文搜索 + sqlite-vec 语义召回;Embedding 在本地通过 ONNX 运行,或切换到 OpenAI/Ollama
分层安全沙箱 三种策略层级(Standard / Strict / Locked);Linux 用 Bubblewrap 隔离代码执行;macOS Seatbelt 暂时只读,Windows 暂无沙箱后端
内置工具集 文件读写编辑、Shell 和后台进程、Git、Web 搜索/抓取(防 SSRF)、电子表格/PPTX/PDF 生成、图片生成、语音合成等
统一网关 Starlette ASGI 服务器,默认 127.0.0.1:18791,内置 WebSocket RPC 和控制台;Web UI、CLI、Slack/Telegram/Discord/飞书/钉钉/企微/QQ/Matrix 等消息通道共享一个 TurnRunner
持久化会话与子 Agent SQLite 持久化存储会话、 transcript、replay;Agent 可生成有限深度的子 Agent;内置 cron 解析器支持定时任务
操作员控制 敏感工具调用可暂停等待人工审批;每轮/每会话 token 和成本实时统计

性能对比

PinchBench 1.2.1(25 个任务)上的测试结果:

Agent 基础模型 平均得分 输入 Token 输出 Token 总成本
OpenSquilla 模型路由器(Opus 4.7、GLM 5.1、DS4 Flash) 0.9251 1,721,328 61,475 $0.688
OpenClaw Claude Opus 4.7 0.9255 3,066,243 50,890 $6.233

两者得分几乎相同(0.9255 vs 0.9251),但 OpenSquilla 的成本仅为 OpenClaw 的 11%,输入 Token 节省了约 44%。

安装方式

推荐:Quick terminal install(跨平台)

# 1. 安装 uv(如果没有)
curl -LsSf https://astral.sh/uv/install.sh | sh
. "$HOME/.local/bin/env"

# 2. 安装 OpenSquilla(含 SquillaRouter)
uv tool install --python 3.12 \
  "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

# 3. 配置并运行
opensquilla onboard
opensquilla gateway run

Windows 便携版(免 Python)

  1. 下载 OpenSquilla-windows-x64-portable.zip
  2. 解压后右键 Start OpenSquilla.cmd以管理员身份运行
  3. 完成首次设置后访问 http://127.0.0.1:18791/control/

从源码安装

git lfs install
git clone https://github.com/opensquilla/opensquilla.git
cd opensquilla
git lfs pull --include="src/opensquilla/squilla_router/models/**"
bash scripts/install_source.sh          # macOS / Linux
powershell -ExecutionPolicy Bypass -File ./scripts/install_source.ps1  # Windows

核心设计:SquillaRouter

SquillaRouter 是 OpenSquilla 的核心竞争力。它是一个本地运行的 LightGBM + ONNX 分类器,从四个层级中选择最适合的模型:

层级 典型模型 适用场景
T0 GPT-4.1 / Claude Opus 复杂推理、多步规划、高难度编码
T1 GPT-4o / Gemini 2.5 中等复杂任务
T2 GPT-4o-mini / Claude 3.5 Haiku 简单推理、摘要
T3 DeepSeek Flash / Qwen Turbo 极简单任务、闲聊

路由器综合考量文本长度、语言类型、代码占比、关键词、语义向量等多个维度,在本地完成决策——Prompt 数据不会发送到外部分类服务。

快速使用

opensquilla gateway start --json    # 后台运行网关
opensquilla chat                     # 交互式终端聊天
opensquilla agent -m "总结这个代码库并告诉我该测什么"  # 单次自动化

# 查看状态
opensquilla doctor                   # 诊断 readiness
opensquilla cost                     # 成本统计
opensquilla sessions list            # 历史会话

支持的消息通道

通道 连接模式 说明
飞书 WebSocket / Webhook 默认 WebSocket,不需要公网地址
Telegram Polling / Webhook 默认 Polling
Discord 支持
Slack Socket Mode / Webhook Socket Mode 不需要公网地址
钉钉
企业微信 Webhook 需要公网可达 URL
QQ
Matrix E2E(可选) 需要 libolm

与 OpenClaw / Hermes Agent 的迁移

OpenSquilla 支持从已有的 Agent 数据目录迁移:

# 预览迁移报告
opensquilla migrate openclaw --json
opensquilla migrate hermes --json

# 应用迁移
opensquilla migrate openclaw --apply
opensquilla migrate hermes --apply

一句话总结

OpenSquilla = 本地路由器(省 Token)+ 统一运行时(CLI/Web UI/消息通道同款)+ 按需 Skills + 持久化记忆 + 分层沙箱。

在保持与 OpenClaw 几乎相同得分的前提下,成本从 $6.233 降到 $0.688——适合需要长期运行、注重成本效率的个人用户或小团队。


项目地址:https://github.com/opensquilla/opensquilla
官方文档:https://opensquilla.ai
当前版本:v0.3.1(2026)


文章作者: 因特吧
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 因特吧 !
评论
  目录