EmpirioLabs AI

Jun 22, 2026

EmpirioLabs AI

Fugu Ultra 是 Sakana AI 的多智能体指挥，现已在 EmpirioLabs 上线。它不再只用单一模型回答，而是在每个请求中协调一批专家模型，并将他们的工作整合成一个答案，Sakana称之为“指挥家”。它专为复杂、高风险的问题而设计：复杂的推理、代码生成与审查、研究以及长时间的多步骤任务。

Fugu Ultra 目前通过兼容 OpenAI 的 API 提供，支持100万令牌上下文窗口、文本和图片输入、可调节推理努力、函数调用、JSON 模式结构化输出以及内置网页搜索。试试在游戏场或者阅读 API 文档。。。.

令牌使用与计费

Fugu Ultra 使用的代币比单一模型多，所以在开始之前了解这一点很有帮助。每个请求内部协调多个专家模型，所有这些工作都整合进你被计费的标准输入和输出令牌数量中。实际上，即使是简短的提示词，也会报告比你发送的文本更多的输入和输出令牌，因为模型的内部协调也会被计入。计费是基于使用量的单一按输入和输出代币定价;精确且始终保持当前的速率，包括折现缓存输入率，分别在模型页面页:1 定价页面。。。.

快速启动

将任何兼容 OpenAI 的客户端指向EmpirioLabs基网并调用 Fugu-Ultra编号:

curl https://api.empiriolabs.ai/v1/chat/completions \ -h “授权：持有者 $EMPIRIOLABS_API_KEY” \ -h “内容类型：application/json” \ -d '{ “model”： “fugu-ultra”， “reasoning_effort”： “high”， “messages”： [ {“role”： “user”， “content”： “概述一个复现机器学习论文结果的计划。”} ] }''

Python OpenAI SDK 无需更改即可运行：

从 openai 导入 OpenAI 客户端 = OpenAI（base_url=“https://api.empiriolabs.ai/v1", api_key=”YOUR_EMPIRIOLABS_KEY“） resp = client.chat.completions.create（ model=”fugu-ultra“， reasoning_effort=”high“， messages=[{”role“： ”user“， ”content“： ”解释 TLS 的工作原理，然后批判你的解释。“}]， ） print（resp.choices[0].message.content）

很高兴知道

回复可能需要一段时间。 因为它每个请求运行多个模型，复杂提示可能需要几秒钟到几分钟。完整答案在模型完成时一次性返回，而不是逐个标记。流式请求依然有效，但最终交付的是完整的响应，而不是流式令牌生成。
推理总是开着。 设定 推理(e) 到 高, (中文), 高，或者 最大数.没有低、低、中之分;Xhigh和Max在最难的题目上投入最多努力。
留出空间给答案。 请慷慨使用 max_tokens，因为极小的极限可能会截断或清空答案。
图像输入。 按标准OpenAI发送图片 image_url 内容部分。上传和网址都能正常使用。
网络搜索。 开启 tool_web_search (英语) 用于内置网页搜索。没有单独的检索费;其成本包含在请求的令牌计数中。
详细背景。 该模型最多支持100万个令牌上下文，因此你可以输入大型文档和代码库。

开始用Fugu Ultra在游戏场，或查看完整的参数列表和示例文献。。。.

如何使用Fugu Ultra API

令牌使用与计费

快速启动

很高兴知道

准备好使用更好的终端了吗？

如何使用Fugu Ultra API

令牌使用与计费

快速启动

很高兴知道

您的下一篇文章

Seedance 2.0 Mini：快速、低成本的视频API

Seedance 2.0 现在可以生成 4K 视频

如何使用 HappyHorse 1.1 API

准备好使用更好的终端了吗？