Fugu Ultra es el director multiagente de Sakana AI, ahora en directo en EmpirioLabs. En lugar de responder desde un único modelo, coordina un grupo de modelos expertos en cada petición y compone su trabajo en una sola respuesta, un enfoque que Sakana llama director. Está diseñado para problemas difíciles y de alto riesgo: razonamiento complejo, generación y revisión de código, investigación y tareas largas de varios pasos.
Fugu Ultra está disponible hoy a través de una API compatible con OpenAI, con una ventana de contexto de token de 1M, entrada de texto e imagen, esfuerzo de razonamiento ajustable, llamada a funciones, salida estructurada en modo JSON y búsqueda web integrada. Pruébalo en el Playground o leer el API docs.
Uso y facturación de tokens
Fugu Ultra usa más fichas que un solo modelo, así que ayuda entenderlo antes de empezar. Cada solicitud coordina varios modelos expertos internamente, y todo ese trabajo se integra en los conteos estándar de tokens de entrada y salida en los que se te factura. En la práctica, incluso un prompt corto informa de más tokens de entrada y salida que el texto que enviaste, porque también se cuenta la coordinación interna del modelo. La facturación es una fijación sencilla basada en el uso por token de esos tokens de entrada y salida; Las tarifas exactas y siempre vigentes, incluyendo la tasa de entrada en caché descontada, están en el página modelo y el página de precios.
Quickstart
Apunta cualquier cliente compatible con OpenAI a la URL base de EmpirioLabs y llama FUGU-ULTRA:
curl https://api.empiriolabs.ai/v1/chat/completions \ -H "Autorización: Portador $EMPIRIOLABS_API_KEY" \ -H "Tipo-Contenido: application/json" \ -d '{ "modelo": "fugu-ultra", "reasoning_effort": "alto", "mensajes": [ {"rol": "usuario", "contenido": "Esquema de un plan para reproducir los resultados de un artículo de aprendizaje automático."} ] }'
El SDK OpenAI en Python funciona sin cambios:
desde openai importación cliente OpenAI = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY") resp = client.chat.completions.create(model="fugu-ultra", reasoning_effort="alto", mensajes=[{"rol": "usuario", "contenido": "Explica cómo funciona TLS, luego critica tu explicación."}],) print(resp.choices[0].message.content)
Es bueno saberlo
- Las respuestas pueden tardar un poco. Como ejecuta varios modelos por solicitud, espera unos segundos o unos minutos en prompts complejos. La respuesta completa se devuelve de inmediato cuando termina el modelo, no ficha por ficha. Las solicitudes de streaming siguen funcionando, pero entregan la respuesta completa al final en lugar de transmitir tokens a medida que se generan.
- El razonamiento siempre está activo. Set
reasoning effortaAlto,xhigh, omax. No hay off, low o medium; Xhigh y Max aplican más esfuerzo para los problemas más difíciles. - Deja espacio para la respuesta. Usa un generoso
max_tokens, ya que límites muy pequeños pueden truncar o vaciar la respuesta. - Entrada de imagen. Envía imágenes como OpenAI estándar
image_urlpartes de contenido. Tanto las subidas como las URLs funcionan. - Búsqueda web. Prender
tool_web_searchpara búsqueda web integrada. No hay una comisión de búsqueda separada; su coste se incluye en el recuento de tokens de la solicitud. - Contexto largo. El modelo acepta hasta un contexto de token de 1M, así que puedes alimentarle documentos grandes y bases de código.
Empieza a construir con Fugu Ultra en el Playground, o véase la lista completa de parámetros y ejemplos en el Documentación.



