Fugu Ultra est le chef d’orchestre multi-agents de Sakana AI, désormais en direct sur EmpirioLabs. Au lieu de répondre à partir d’un seul modèle, il coordonne un pool de modèles experts pour chaque demande et compose leur travail en une seule réponse, une approche que Sakana appelle chef d’orchestre. Il est conçu pour des problèmes difficiles et à enjeux élevés: raisonnement complexe, génération et révision de code, recherche, et tâches longues en plusieurs étapes.
Fugu Ultra est disponible aujourd’hui via une API compatible OpenAI, avec une fenêtre contextuelle de jeton de 1M, une entrée texte et image, un effort de raisonnement ajustable, un appel de fonction, une sortie structurée en mode JSON et une recherche web intégrée. Essaie-le dans le Terrain de jeu ou lire le Docs API.
Utilisation et facturation des jetons
Fugu Ultra utilise plus de jetons qu’un seul modèle, donc il est utile de comprendre cela avant de commencer. Chaque requête coordonne plusieurs modèles experts en interne, et tout ce travail est intégré aux décomptes standards de jetons d’entrée et de sortie sur lesquels vous êtes facturé. En pratique, même une courte invite rapporte plus de jetons d’entrée et de sortie que le texte que vous avez envoyé, car la coordination interne du modèle est aussi prise en compte. La facturation consiste simplement à fixer la tarification par jeton basée sur l’utilisation des jetons d’entrée et de sortie; Les tarifs exacts, toujours en vigueur, y compris le taux d’entrée mise en cache réduit, sont sur le page modèle et les page de prix.
Démarrer rapidement
Pointer n’importe quel client compatible OpenAI à l’URL de base EmpirioLabs et appeler fugu-ultra:
curl https://api.empiriolabs.ai/v1/chat/completions \ -H « Autorisation: Porteur $EMPIRIOLABS_API_KEY » \ -H « Type-de contenu: application/json » \ -d '{ « modèle »: « fugu-ultra », « reasoning_effort »: « high », « messages »: [ {"role »: « user », « content »: « Esquisse un plan pour reproduire les résultats d’un article d’apprentissage automatique."} ] }'
Le SDK OpenAI en Python fonctionne sans modifications:
depuis openai import client OpenAI = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY ») resp = client.chat.completions.create(model="fugu-ultra », reasoning_effort="high », messages=[{"role »: « user », « content »: « Expliquez comment fonctionne TLS, puis critiquez votre explication."}],) print(resp.choices[0].message.content)
Bon à savoir
- Les réponses peuvent prendre du temps. Comme il exécute plusieurs modèles par requête, attendez-vous à quelques secondes à quelques minutes sur des indications complexes. La réponse complète est retournée d’un coup lorsque le modèle est terminé, et non jeton par jeton. Les requêtes en streaming fonctionnent toujours, mais livrent la réponse complète à la fin plutôt que de diffuser les jetons au fur et à mesure qu’ils sont générés.
- La raison est toujours en place. Jeu
raisonnement effortàhaut,xhigh, oumax. Il n’y a pas de off, de faible ou moyen; Xhigh et Max fournissent le plus d’efforts pour les problèmes les plus difficiles. - Laisse de la place à la réponse. Utilisez un généreux
max_tokens, puisque des limites très petites peuvent tronquer ou vider la réponse. - Entrée d’image. Envoyer des images en mode OpenAI standard
image_urlParties de contenu. Les téléchargements et les URL fonctionnent tous les deux. - Recherche sur le web. Allumez-vous
tool_web_searchpour la recherche web intégrée. Il n’y a pas de frais de recherche séparés; son coût est inclus dans le nombre de jetons de la demande. - Contexte long. Le modèle accepte jusqu’à 1M de jetons contextuels, donc vous pouvez lui fournir de gros documents et des bases de code.
Commence à construire avec Fugu Ultra dans le Terrain de jeu, ou voir la liste complète des paramètres et les exemples dans le Documentation.



