
100만 개의 맥락, 이미지 입력, 웹 검색을 활용해 하드 디론, 코딩, 연구를 위한 프런티어 전문가 모델을 조율하는 다중 에이전트 지휘자입니다.
100만 개의 맥락, 이미지 입력, 웹 검색을 활용해 하드 디론, 코딩, 연구를 위한 프런티어 전문가 모델을 조율하는 다중 에이전트 지휘자입니다.
텍스트 및 이미지 입력, 1M 토큰 컨텍스트, 함수 호출, JSON 모드 구조화 출력, 내장 웹 검색 지원을 지원합니다. 이성은 항상 노력 수준이 높고, xhigh, max(xhigh와 max가 가장 많은 노력을 가합니다)에서 켜져 있습니다. 웹 검색은 별도의 요금이 없습니다; 그 비용은 지휘자가 사용 현황을 보고하는 오케스트레이션 토큰에 반영됩니다. 오케스트레이션 토큰은 프롬프트와 최종 답변과 동일한 입력 및 출력 비율로 청구되기 때문에, 짧은 요청도 오케스트레이션 비용이 포함됩니다.
다른 이름 Sakana AI Fugu Ultra, Fugu-Ultra
fugu-ultraPOST /v1/chat/completionsPOST /v1/responsesPOST /v1/messagesLive pay-as-you-go rates from the EmpirioLabs catalog. You are billed only for what you use, with no monthly minimum.
Fugu Ultra serves the OpenAI-compatible Chat Completions API. Point any OpenAI SDK at https://api.empiriolabs.ai/v1 with your EmpirioLabs API key and use the model id fugu-ultra. Get an API key from the EmpirioLabs dashboard.
curl https://api.empiriolabs.ai/v1/chat/completions \
-H "Authorization: Bearer $EMPIRIOLABS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "fugu-ultra",
"messages": [
{"role": "user", "content": "Write a haiku about the ocean."}
]
}'from openai import OpenAI
client = OpenAI(
base_url="https://api.empiriolabs.ai/v1",
api_key="YOUR_EMPIRIOLABS_API_KEY",
)
response = client.chat.completions.create(
model="fugu-ultra",
messages=[{"role": "user", "content": "Write a haiku about the ocean."}],
)
print(response.choices[0].message.content)Request parameters supported by the Fugu Ultra API on EmpirioLabs. Defaults apply when a field is omitted.
| 파라미터 | 유형 | 기본 | 범위 / 값 | 설명 |
|---|---|---|---|---|
| max_tokens | integer | 32768 | 1 to 131072 | Maximum number of output tokens for the final answer. The conductor needs room to work, so very small values can return empty output. |
| reasoning_effort | enum | high | high, xhigh, max | How hard Fugu Ultra reasons. Reasoning is always on. The default is high; xhigh and max are aliases of the same maximum effort (more thorough and slower than high). |
| tool_web_search | boolean | false | - | Enable built-in web search. There is no separate fee; the search cost is reflected in the orchestration tokens billed for the request. |
| tools | array | [] | - | OpenAI-compatible function calling tool definitions. |
| tool_choice | object | - | - | OpenAI-compatible tool choice control. |
| response_format | object | - | - | OpenAI-compatible JSON mode for structured output. |
Fugu Ultra는 다중 에이전트 지휘자입니다: 각 요청은 전문가 모델들의 풀을 조율하고 그들의 작업을 하나의 답변으로 구성합니다. 지연 및 스트리밍 - 복잡한 프롬프트의 경우 응답이 몇 초에서 몇 분까지 걸릴 수 있습니다. - 전체 답변은 모델이 끝나면 토큰 단위가 아니라 한 번에 반환됩니다. 스트리밍은 허용되지만, 스트리밍 토큰이 생성되는 대신 전체 응답을 마지막에 전달합니다. - 매우 작은 한계가 답을 잘라내거나 비울 수 있으므로 충분한 max_tokens 여유를 남겨두세요. 기능 - 텍스트 및 이미지 입력, 1M 토큰 컨텍스트. - 항상 연결된 논리. 기본값은 하이입니다; xhigh와 max는 같은 최대 노력량입니다. - 함수 호출, JSON 모드, 출처를 제공하는 내장 웹 검색(별도 비용 없음). 청구 - 모델 내부에서 사용하는 오케스트레이션 토큰을 포함한 전체 토큰 사용량에 대해 청구되므로 짧은 프롬프트에도 일정 비용이 발생합니다. - 컨텍스트 계층: 총 입력 토큰 272,000개를 초과하는 요청이 표시된 더 높은 비율을 사용합니다.
On EmpirioLabs, Fugu Ultra is billed pay as you go: 이름 * <=272K $7.50; >272K $15.00 1M 신속한 토큰 당; 제품정보 <=272K $45.00; >272K $67.50 1M 생성 토큰; Implicit 캐시 읽기 <=272K $1.50; >272K $3.00 1M 캐시된 입력 토큰 당. The live rate card on this page always matches what the API charges.
Fugu Ultra supports a 1M-token context window with up to 131,072 output tokens per response.
Yes. Fugu Ultra serves the OpenAI-compatible Chat Completions API, so existing OpenAI SDKs work by pointing base_url at https://api.empiriolabs.ai/v1 and setting the model id to fugu-ultra.
Yes. The EmpirioLabs playground runs Fugu Ultra in the browser with the same parameters the API exposes, so you can test prompts before writing code.
Create an EmpirioLabs account, then generate a key under API Keys in the dashboard. Billing is pay-as-you-go credits, so you only pay for the requests you make.
Check out our pricing or reach out if you want your own model deployed on our stack.