Fugu Ultra 是 Sakana AI 的多智能体指挥,现已在 EmpirioLabs 上线。它不再只用单一模型回答,而是在每个请求中协调一批专家模型,并将他们的工作整合成一个答案,Sakana称之为“指挥家”。它专为复杂、高风险的问题而设计:复杂的推理、代码生成与审查、研究以及长时间的多步骤任务。
Fugu Ultra 目前通过兼容 OpenAI 的 API 提供,支持100万令牌上下文窗口、文本和图片输入、可调节推理努力、函数调用、JSON 模式结构化输出以及内置网页搜索。试试在 游戏场 或者阅读 API 文档。 。 。.
令牌使用与计费
Fugu Ultra 使用的代币比单一模型多,所以在开始之前了解这一点很有帮助。每个请求内部协调多个专家模型,所有这些工作都整合进你被计费的标准输入和输出令牌数量中。实际上,即使是简短的提示词,也会报告比你发送的文本更多的输入和输出令牌,因为模型的内部协调也会被计入。计费是基于使用量的单一按输入和输出代币定价;精确且始终保持当前的速率,包括折现缓存输入率,分别在 模型页面 页:1 定价页面。 。 。.
快速启动
将任何兼容 OpenAI 的客户端指向EmpirioLabs基网并调用 Fugu-Ultra编号:
curl https://api.empiriolabs.ai/v1/chat/completions \ -h “授权:持有者 $EMPIRIOLABS_API_KEY” \ -h “内容类型:application/json” \ -d '{ “model”: “fugu-ultra”, “reasoning_effort”: “high”, “messages”: [ {“role”: “user”, “content”: “概述一个复现机器学习论文结果的计划。”} ] }''
Python OpenAI SDK 无需更改即可运行:
从 openai 导入 OpenAI 客户端 = OpenAI(base_url=“https://api.empiriolabs.ai/v1", api_key=”YOUR_EMPIRIOLABS_KEY“) resp = client.chat.completions.create( model=”fugu-ultra“, reasoning_effort=”high“, messages=[{”role“: ”user“, ”content“: ”解释 TLS 的工作原理,然后批判你的解释。“}], ) print(resp.choices[0].message.content)
很高兴知道
- 回复可能需要一段时间。 因为它每个请求运行多个模型,复杂提示可能需要几秒钟到几分钟。完整答案在模型完成时一次性返回,而不是逐个标记。流式请求依然有效,但最终交付的是完整的响应,而不是流式令牌生成。
- 推理总是开着。 设定
推理(e)到高, (中文),高,或者最大数.没有低、低、中之分;Xhigh和Max在最难的题目上投入最多努力。 - 留出空间给答案。 请慷慨使用
max_tokens,因为极小的极限可能会截断或清空答案。 - 图像输入。 按标准OpenAI发送图片
image_url内容部分。上传和网址都能正常使用。 - 网络搜索。 开启
tool_web_search (英语)用于内置网页搜索。没有单独的检索费;其成本包含在请求的令牌计数中。 - 详细背景。 该模型最多支持100万个令牌上下文,因此你可以输入大型文档和代码库。



