EmpirioLabs AI

Jun 22, 2026

EmpirioLabs AI

Fugu Ultra es el director multiagente de Sakana AI, ahora en directo en EmpirioLabs. En lugar de responder desde un único modelo, coordina un grupo de modelos expertos en cada petición y compone su trabajo en una sola respuesta, un enfoque que Sakana llama director. Está diseñado para problemas difíciles y de alto riesgo: razonamiento complejo, generación y revisión de código, investigación y tareas largas de varios pasos.

Fugu Ultra está disponible hoy a través de una API compatible con OpenAI, con una ventana de contexto de token de 1M, entrada de texto e imagen, esfuerzo de razonamiento ajustable, llamada a funciones, salida estructurada en modo JSON y búsqueda web integrada. Pruébalo en el Playground o leer el API docs.

Uso y facturación de tokens

Fugu Ultra usa más fichas que un solo modelo, así que ayuda entenderlo antes de empezar. Cada solicitud coordina varios modelos expertos internamente, y todo ese trabajo se integra en los conteos estándar de tokens de entrada y salida en los que se te factura. En la práctica, incluso un prompt corto informa de más tokens de entrada y salida que el texto que enviaste, porque también se cuenta la coordinación interna del modelo. La facturación es una fijación sencilla basada en el uso por token de esos tokens de entrada y salida; Las tarifas exactas y siempre vigentes, incluyendo la tasa de entrada en caché descontada, están en el página modelo y el página de precios.

Quickstart

Apunta cualquier cliente compatible con OpenAI a la URL base de EmpirioLabs y llama FUGU-ULTRA:

curl https://api.empiriolabs.ai/v1/chat/completions \ -H "Autorización: Portador $EMPIRIOLABS_API_KEY" \ -H "Tipo-Contenido: application/json" \ -d '{ "modelo": "fugu-ultra", "reasoning_effort": "alto", "mensajes": [ {"rol": "usuario", "contenido": "Esquema de un plan para reproducir los resultados de un artículo de aprendizaje automático."} ] }'

El SDK OpenAI en Python funciona sin cambios:

desde openai importación cliente OpenAI = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY") resp = client.chat.completions.create(model="fugu-ultra", reasoning_effort="alto", mensajes=[{"rol": "usuario", "contenido": "Explica cómo funciona TLS, luego critica tu explicación."}],) print(resp.choices[0].message.content)

Es bueno saberlo

Las respuestas pueden tardar un poco. Como ejecuta varios modelos por solicitud, espera unos segundos o unos minutos en prompts complejos. La respuesta completa se devuelve de inmediato cuando termina el modelo, no ficha por ficha. Las solicitudes de streaming siguen funcionando, pero entregan la respuesta completa al final en lugar de transmitir tokens a medida que se generan.
El razonamiento siempre está activo. Set reasoning effort a Alto, xhigh, o max. No hay off, low o medium; Xhigh y Max aplican más esfuerzo para los problemas más difíciles.
Deja espacio para la respuesta. Usa un generoso max_tokens, ya que límites muy pequeños pueden truncar o vaciar la respuesta.
Entrada de imagen. Envía imágenes como OpenAI estándar image_url partes de contenido. Tanto las subidas como las URLs funcionan.
Búsqueda web. Prender tool_web_search para búsqueda web integrada. No hay una comisión de búsqueda separada; su coste se incluye en el recuento de tokens de la solicitud.
Contexto largo. El modelo acepta hasta un contexto de token de 1M, así que puedes alimentarle documentos grandes y bases de código.

Empieza a construir con Fugu Ultra en el Playground, o véase la lista completa de parámetros y ejemplos en el Documentación.

Cómo usar la API de Fugu Ultra

Uso y facturación de tokens

Quickstart

Es bueno saberlo

¿Listo para usar mejores endpoints?

Cómo usar la API de Fugu Ultra

Uso y facturación de tokens

Quickstart

Es bueno saberlo

Tus próximos artículos

Seedance 2.0 Mini: La API de vídeo rápida y de bajo coste

Seedance 2.0 ahora genera vídeo 4K

Cómo usar la API HappyHorse 1.1

¿Listo para usar mejores endpoints?