Zuhause Blog

Wie man die Fugu Ultra API verwendet

Fugu Ultra über API-Abdeckung

Jun 22, 2026

EmpirioLabs AI

Fugu Ultra ist der Multi-Agenten-Leiter von Sakana AI, jetzt live auf EmpirioLabs. Anstatt aus einem einzigen Modell zu antworten, koordiniert es bei jeder Anfrage einen Pool von Expertenmodellen und fasst deren Arbeit in einer Antwort zusammen, einem Ansatz, den Sakana als Conductor bezeichnet. Es ist für schwierige, hochriskante Probleme konzipiert: komplexes Denken, Codegenerierung und -überprüfung, Forschung und lange mehrstufige Aufgaben.

Fugu Ultra ist heute über eine OpenAI-kompatible API verfügbar, mit einem 1M-Token-Kontextfenster, Text- und Bildeingaben, einstellbarem Denkaufwand, Funktionsaufrufen, strukturierter Ausgabe im JSON-Modus und integrierter Websuche. Probier es in der Spielplatz oder lies die API-Doku.

Token-Nutzung und Abrechnung

Fugu Ultra verwendet mehr Token als ein einzelnes Modell, daher ist es hilfreich, das vorher zu verstehen. Jede Anfrage koordiniert mehrere Expertenmodelle intern, und all diese Arbeit wird in die Standard-Eingabe- und Ausgabe-Token-Zahlen eingefügt, für die du abgerechnet wirst. In der Praxis berichtet selbst ein kurzer Prompt mehr Eingabe- und Ausgabetoken als der gesendete Text, weil auch die interne Koordination des Modells gezählt wird. Die Abrechnung ist eine einfache nutzungsbasierte Preisgestaltung pro Token für diese Eingabe- und Ausgabetoken; Die exakten, immer aktuellen Raten, einschließlich der diskontierten Cache-Eingangsrate, liegen auf dem modellblatt und die preisseite.

Quickstart

Zeigen Sie jeden OpenAI-kompatiblen Client auf die EmpirioLabs Basis-URL und rufen Sie auf fugu-ultra:

curl https://api.empiriolabs.ai/v1/chat/completions \ -h "Autorisierung: Träger $EMPIRIOLABS_API_KEY" \ -H "Inhaltstyp: application/json" \ -d '{ "model": "fugu-ultra", "reasoning_effort": "high", "messages": [ {"role": "user", "content": "Skizzieren Sie einen Plan zur Reproduktion der Ergebnisse eines maschinellen Lernpapiers."} ] }'

Das Python OpenAI SDK funktioniert ohne Änderungen:

von openai-import OpenAI-Client = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY") resp = client.chat.completions.create(model="fugu-ultra", reasoning_effort="high", messages=[{"role": "user", "content": "erklären Sie, wie TLS funktioniert, und dann Ihre Erklärung kritisieren."}],) print(resp.choices[0].message.content)

Gut zu wissen

  • Antworten können eine Weile dauern. Da es mehrere Modelle pro Anfrage ausführt, kann man mit einigen Sekunden bis Minuten bei komplexen Eingabeaufforderungen rechnen. Die vollständige Antwort wird sofort zurückgegeben, wenn das Modell fertig ist, nicht Token für Token. Streaming-Anfragen funktionieren weiterhin, liefern aber am Ende die vollständige Antwort statt Streaming-Token, sobald sie generiert werden.
  • Das Denken ist immer an. Setz reasoning effort zu hoch, xhigh, oder max. Es gibt keine Off, Low oder Medium; Xhigh und Max bringen den größten Aufwand für die schwierigsten Probleme.
  • Lassen Sie Raum für die Antwort. Benutze großzügig max_tokens, da sehr kleine Grenzen die Antwort abschneiden oder leeren können.
  • Bildeingabe. Bilder wie Standard-OpenAI senden image_url Content-Teile. Sowohl Uploads als auch URLs funktionieren.
  • Websuche. Einschalten tool_web_search für integrierte Websuche. Es fällt keine separate Suchgebühr an; seine Kosten sind im Token-Count der Anfrage enthalten.
  • Langer Kontext. Das Modell akzeptiert bis zu 1 Millionen Token-Kontexte, sodass man große Dokumente und Codebasen einführen kann.

Fang an, mit Fugu Ultra in der Spielplatz, oder siehe die vollständige Parameterliste und Beispiele in der Dokumentation.

Bereit, bessere Endpunkte zu nutzen?

Entdecken Sie unsere Modelle oder kontaktieren Sie uns bei Geschäftsanfragen, individuellen Deployments oder sonst etwas.