
100万のコンテキスト、画像入力、ウェブ検索を用いて、ハード推論、コーディング、研究のためにフロンティアの専門家モデルをオーケストレーションするマルチエージェント指揮者。
100万のコンテキスト、画像入力、ウェブ検索を用いて、ハード推論、コーディング、研究のためにフロンティアの専門家モデルをオーケストレーションするマルチエージェント指揮者。
テキストおよび画像入力、1Mトークンコンテキスト、関数呼び出し、JSONモードの構造化出力、組み込みのウェブ検索をサポートします。推理は常に努力レベルが高い、xhigh、max(xhighとmaxが最も努力を多くかける)でオンです。ウェブ検索には別料金はかかりません。そのコストは、指揮者が使用状況を報告するオーケストレーショントークンに反映されます。オーケストレーショントークンはプロンプトや最終回答と同じ入力・出力料金で請求されるため、短いリクエストでもオーケストレーションコストがかかります。
別名 Sakana AI Fugu Ultra, Fugu-Ultra
fugu-ultraPOST /v1/chat/completionsPOST /v1/responsesPOST /v1/messagesLive pay-as-you-go rates from the EmpirioLabs catalog. You are billed only for what you use, with no monthly minimum.
Fugu Ultra serves the OpenAI-compatible Chat Completions API. Point any OpenAI SDK at https://api.empiriolabs.ai/v1 with your EmpirioLabs API key and use the model id fugu-ultra. Get an API key from the EmpirioLabs dashboard.
curl https://api.empiriolabs.ai/v1/chat/completions \
-H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "fugu-ultra",
"messages": [
{"role": "user", "content": "Write a haiku about the ocean."}
]
}'from openai import OpenAI
client = OpenAI(
base_url="https://api.empiriolabs.ai/v1",
api_key="YOUR_EMPIRIOLABS_API_KEY",
)
response = client.chat.completions.create(
model="fugu-ultra",
messages=[{"role": "user", "content": "Write a haiku about the ocean."}],
)
print(response.choices[0].message.content)Request parameters supported by the Fugu Ultra API on EmpirioLabs. Defaults apply when a field is omitted.
| パラメータ | タイプ | デフォルト | 範囲 / 値 | 説明 |
|---|---|---|---|---|
| max_tokens | integer | 32768 | 1 to 131072 | Maximum number of output tokens for the final answer. The conductor needs room to work, so very small values can return empty output. |
| reasoning_effort | enum | high | high, xhigh, max | How hard Fugu Ultra reasons. Reasoning is always on. The default is high; xhigh and max are aliases of the same maximum effort (more thorough and slower than high). |
| tool_web_search | boolean | false | - | Enable built-in web search. There is no separate fee; the search cost is reflected in the orchestration tokens billed for the request. |
| tools | array | [] | - | OpenAI-compatible function calling tool definitions. |
| tool_choice | object | - | - | OpenAI-compatible tool choice control. |
| response_format | object | - | - | OpenAI-compatible JSON mode for structured output. |
Fugu Ultraはマルチエージェントコンダクターであり、各リクエストが専門家モデルのプールを調整し、それらの作業を単一の回答にまとめます。レイテンシとストリーミング - 複雑なプロンプトの場合、応答は数秒から数分かかることがあります。- モデルが終了した時点で全ての回答が一度に返され、トークンごとに返されるわけではありません。ストリーミングは受け入れられますが、トークンを生成する際にストリームが生成されるのではなく、最終的に完全なレスポンスを届けます。- 非常に小さな限界が答えを切り詰めたり空にしたりする可能性があるため、十分なヘッドルームmax_tokens残すこと。機能 - テキストおよび画像入力、1Mトークンコンテキスト付き。- 常に理屈に傾く。高がデフォルトです。xhighとmaxは同じ最大努力値です。- 関数呼び出し、JSONモード、利用可能な場合は出典を明示する組み込みウェブ検索(別料金なし)。Billing - モデル内部で使うオーケストレーショントークンを含む全トークン使用量で請求されるため、短いプロンプトでも一定のコストが発生します。- コンテキスト階層型:272,000以上のリクエストが表示されたより高いレートを使用します。
On EmpirioLabs, Fugu Ultra is billed pay as you go: パスワード <=272K $7.50; >272K $15.00 1M プロンプトトークンあたり; ソリューション <=272K $45.00; >272K $67.50 1M生成トークンあたり; キャッシュの読み込み <=272K $1.50; >272K $3.00 1M キャッシュされた入力トークンあたり. The live rate card on this page always matches what the API charges.
Fugu Ultra supports a 1M-token context window with up to 131,072 output tokens per response.
Yes. Fugu Ultra serves the OpenAI-compatible Chat Completions API, so existing OpenAI SDKs work by pointing base_url at https://api.empiriolabs.ai/v1 and setting the model id to fugu-ultra.
Yes. The EmpirioLabs playground runs Fugu Ultra in the browser with the same parameters the API exposes, so you can test prompts before writing code.
Create an EmpirioLabs account, then generate a key under API Keys in the dashboard. Billing is pay-as-you-go credits, so you only pay for the requests you make.
Check out our pricing or reach out if you want your own model deployed on our stack.