Casa Blog

Como Usar a API Fugu Ultra

Fugu Ultra via API cover

Jun 22, 2026

EmpirioLabs AI

Fugu Ultra é o maestro multiagente da Sakana AI, agora ao ar no EmpirioLabs. Em vez de responder a partir de um único modelo, ele coordena um conjunto de modelos especialistas em cada solicitação e compõe seu trabalho em uma única resposta, uma abordagem que Sakana chama de maestro. Ele foi desenvolvido para problemas difíceis e de alto risco: raciocínio complexo, geração e revisão de código, pesquisa e tarefas longas de múltiplas etapas.

O Fugu Ultra está disponível hoje por meio de uma API compatível com OpenAI, com janela de contexto de token de 1M, entrada de texto e imagem, esforço de raciocínio ajustável, chamada de funções, saída estruturada em modo JSON e busca web integrada. Tente no Área de reprodução ou leia o Documentos de API.

Uso e faturamento de tokens

Fugu Ultra usa mais tokens do que um único modelo, então ajuda entender isso antes de começar. Cada requisição coordena vários modelos especialistas internamente, e todo esse trabalho é incorporado às contagens padrão de tokens de entrada e saída pelas quais você é cobrado. Na prática, até mesmo um prompt curto reporta mais tokens de entrada e saída do que o texto que você enviou, porque a coordenação interna do modelo também é contabilizada. A cobrança é uma precificação direta por token baseada no uso, nesses tokens de entrada e saída; As taxas exatas e sempre atuais, incluindo a taxa de entrada em cache com desconto, estão no página do modelo e o página de preços.

Início rápido

Aponte qualquer cliente compatível com OpenAI na URL base EmpirioLabs e ligue fugu-ultra:

curl https://api.empiriolabs.ai/v1/chat/completions \ -H "Autorização: Portador $EMPIRIOLABS_API_KEY" \ -H "Tipo-Conteúdo: application/json" \ -d '{ "modelo": "fugu-ultra", "reasoning_effort": "alto", "mensagens": [ {{"função": "usuário", "conteúdo": "Esboço um plano para reproduzir os resultados de um artigo de aprendizado de máquina."} ] }'

O SDK OpenAI em Python funciona sem alterações:

from openai import cliente OpenAI = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY") resp = client.chat.completions.create(model="fugu-ultra", reasoning_effort="alto", messages=[{"role": "user", "content": "Explique como o TLS funciona, depois critique sua explicação."}],) print(resp.choices[0].message.content)

É bom saber

  • Respostas podem demorar um pouco. Como roda vários modelos por requisição, espere alguns segundos a alguns minutos em prompts complexos. A resposta completa é retornada de uma vez quando o modelo termina, não ficha por ficha. As requisições de streaming ainda funcionam, mas entregam a resposta completa no final, em vez de transmitir tokens conforme são gerados.
  • A razão está sempre ativa. Definir raciocinação esforço para alto, xhigh, ou max. Não há off, low ou medium; Xhigh e Max se esforçam mais nos problemas mais difíceis.
  • Deixe espaço para a resposta. Use um generoso max_tokens, já que limites muito pequenos podem truncar ou esvaziar a resposta.
  • Entrada de imagem. Envie imagens como OpenAI padrão image_url partes do conteúdo. Tanto uploads quanto URLs funcionam.
  • Busca na web. Ligue tool_web_search para busca web integrada. Não há taxa de busca separada; seu custo está incluído na contagem de tokens do pedido.
  • Contexto longo. O modelo aceita até um contexto de token de 1M, então você pode fornecer documentos e bases de código grandes para ele.

Comece a construir com Fugu Ultra no Área de reprodução, ou veja a lista completa de parâmetros e exemplos no Documentação.

Pronto para usar endpoints melhores?

Explore nossos modelos ou entre em contato conosco para consultas de negócios, implantações personalizadas ou qualquer outra coisa.