フグウルトラはSakana AIのマルチエージェント指揮者で、現在EmpirioLabsでライブ配信中です。単一のモデルから回答するのではなく、各リクエストに対して専門家モデルのプールを調整し、それらの作品を一つの回答にまとめる。これはサカナが「指揮者」と呼ぶ手法だ。複雑な推論、コード生成とレビュー、研究、そして長時間にわたる多段階のタスクなど、難しく高リスクな問題に対応して作られています。
Fugu Ultraは現在、OpenAI互換APIを通じて利用可能で、1Mトークンコンテキストウィンドウ、テキストおよび画像入力、調整可能な推論努力、関数呼び出し、JSONモードの構造化出力、組み込みのウェブ検索機能を備えています。試してみて プレイグラウンド または API ドキュメントお問い合わせ.
トークンの使用と課金
Fugu Ultraは単一のモデルよりも多くのトークンを使うので、始める前にこの点を理解しておくと役立ちます。各リクエストは内部で複数のエキスパートモデルを調整し、その作業はすべて標準的な入力・出力トークンカウントに組み込まれています。実際には、短いプロンプトでも入力・出力トークンの数がテキストより多く報告されます。なぜならモデルの内部調整もカウントされるからです。請求は、入力トークンと出力トークンに対する使用量に基づく単純な価格設定です。正確な常時運行レート(割引キャッシュ入力率を含む)は モデルページ そして、 プライシングページお問い合わせ.
クイックスタート
任意のOpenAI互換クライアントをEmpirioLabsの基本URLに向けて呼び出します フグウルトラ:
curl https://api.empiriolabs.ai/v1/chat/completions \ -h 「認証:ベアラー $EMPIRIOLABS_API_KEY」\ -H 「Content-Type: application/json」 \ -d '{ "model": "fugu-ultra", "reasoning_effort": "high", "messages": [ {"role": "user", "content": "機械学習論文の結果を再現する計画の概要"} ] }''
Python OpenAI SDKは変更なしで動作します:
openaiからインポート OpenAIクライアント = OpenAI(base_url="https://api.empiriolabs.ai/v1", api_key="YOUR_EMPIRIOLABS_KEY") resp = client.chat.completions.create(model="fugu-ultra", reasoning_effort="high", messages=[{"role": "user", "content": "TLSの仕組みを説明し、説明を批評しなさい."}],) print(resp.choices[0].message.content)
よく知る
- 返答には時間がかかることがあります。 1回のリクエストで複数のモデルを実行するため、複雑なプロンプトの場合は数秒から数分かかると予想されます。完全な回答はモデルが完成した時点で一度に返され、トークンごとに返されるわけではありません。ストリーミングリクエストは依然として機能しますが、トークンを生成するのではなく、完全な応答を最後に届けます。
- 理屈は常に有効です。 セット
理由 努力から高く,xhigh、またはマックス.オフ、ロー、ミディアムは存在しません。XhighとMaxは最も難しい問題に最も努力を注いでいます。 - 答えの余地を残しておけ。 寛大なものを使いましょう
max_tokens、非常に小さな極限では答えを切り捨てたり空にしたりすることがあります。 - 画像入力。 標準のOpenAIとして画像を送信
image_url内容部分。アップロードもURLも動作します。 - ウェブ検索。 オンにしてください
お問い合わせ組み込みのウェブ検索用です。別途捜索料金はかかりません。そのコストはリクエストのトークンカウントに含まれます。 - 長い背景を。 このモデルは最大100万トークンコンテキストを受け入れるため、大きなドキュメントやコードベースを入力できます。



