私たちは2つのフロンティアモデルにまったく同じ5つのコーディングプロンプトを与え、それぞれが作ったものを記録しました。編集もリトライも、チェリーピッキングもなし。 フグウルトラ サカナAIから GLM 5.2 Z.ai からそれぞれ、自己プレイ型のAsteroids、セルフプレイ型のPong、プラズマフィールド、ワームホールトンネル、ハイパースペーススターフィールドを書き、すべてライブラリのない自己完結型HTMLファイルでした。両方のモデルは1つのOpenAI互換APIの背後でEmpirioLabs上で動作しているため、モデル名を入れ替えた1つのリクエストボディでした。
5試合すべてを見てください
運営方法
各プロンプトは1つのユーザーメッセージとして各モデルに送られ、編集なしで返ってきたものを正確にレンダリングしました。理性の努力は両方とも最大に設定されていました。Fugu Ultraは常に思考を稼働させ、GLM 5.2は最高の理性的な努力で動いていました。温度のオーバーライドもシステムプロンプトもありません。最大出力は32,000トークンでした。すべてのプロンプトは、すべてのCSSとJavaScriptがインラインに入り、外部ライブラリやCDNリンク、インポートなしの単一の自己完結型HTMLファイルを求めていました。
結果
両モデルとも5つのプロンプトすべてで初回の試行で動作するコードを返しました。こちらが各回答のサイズで、最終HTMLファイルの線単位で測定しています。
| テスト | フグウルトラ | GLM 5.2 |
|---|---|---|
| セルフプレイアステロイド | 948行 | 656行 |
| セルフプレイポン | 486路線 | 412路線 |
| プラズマフィールド | 298路線 | 131行 |
| ワームホールトンネル | 255路線 | 199ライン |
| ハイパースペース・スターフィールド | 241行 | 166行 |
私たちが気づいたこと
この2つのモデルは内部で非常に異なる動作をしており、テストでそれが示されています。Fugu Ultraはマルチエージェントによるオーケストレーションモデルで、応答前に複数回の内部推論パスを実行するため、1タスクあたりはるかに長い時間を費やし、その過程でより多くの推論を生み出しました。また、プロンプトごとにより多くのコード行を書きました。GLM 5.2は1Mトークンコンテキストウィンドウを持つ高速のシングルパスモデルで、よりコンパクトなファイルを短時間で返すことができました。どちらのアプローチもここでの勝者ではありません。それぞれ異なる作業用に作られており、最適な選択はリクエストごとの最大深度や速度・ボリュームのどちらを望むかによって異なります。
私たちは意図的に勝者を挙げているわけではありません。クリップを見て、それぞれのレンダリングがどのように見え、どのように振る舞い、自分の使い方に合わせて判断してください。
自分で同じテストを行ってください
両モデルともOpenAI互換のチャットコンプリートAPIに対応しているため、切り替えは一言で切り替えられます。ポイント base_url at https://api.empiriolabs.ai/v1 モデルIDを フグウルトラ または お問い合わせお問い合わせ.
curl https://api.empiriolabs.ai/v1/chat/completions \ -H 「認証:ベアラー $EMPIRIOLABS_API_KEY」\ -H 「Content-Type: application/json」 \ -d '{ "model": "fugu-ultra", "messages": [{"role": "user", "content": "Statorids ゲームを単一のHTMLファイルとして構築、ライブラリなし。"}] }''
変化 「モデル」:「フグウルトラ」 から 「モデル」:「glm-5-2」 そしてもう一度実行してください。それがEmpirioLabsの目的です:すべてのフロンティアモデルを1つのAPIで管理し、自分でプロンプト上で比較できるように、何も配線を変えずに済みます。また、両方を並べて使うこともできます。 プレイグラウンドお問い合わせ.
よくある質問
どのモデルがテストされましたか?
Sakana AIのFugu Ultraと Z.ai のGLM 5.2は、どちらもOpenAI互換APIを通じてEmpirioLabsで利用可能です。
5つのコーディングタスクは何でしたか?
セルフプレイ型のアステロイドゲーム、セルフプレイ型ポンゲーム、デモシーンのプラズマ効果、無限のワームホールトンネル、そしてハイパースペースのスターフィールドワープ。それぞれは外部ライブラリのない、自己完結型のHTMLファイルでなければなりませんでした。
編集や再挑戦はありましたか?
いいえ。各モデルはプロンプトごとに1ショットずつ割り当てられ、返された通りにレンダリングしました。見た目が良くてもそうでなくても、結果はそのままにしました。
なぜフグウルトラは時間がかかるのですか?
Fugu Ultraは、常にオンな推論を持つマルチエージェントによるオーケストレーションモデルです。応答前に複数回の内部パスを行っており、スピードを犠牲にして深みを得ています。GLM 5.2は一回の回答で解決します。
2つのモデルをどうやって切り替えればいいですか?
弦を一本変えて。両者ともOpenAIチャットコンプリートAPIを提供しています。 https://api.empiriolabs.ai/v1モデルIDを に設定します フグウルトラ または お問い合わせ それ以外はすべて変わらない。
試してみて
遊び場を開く お問い合わせ Fugu Ultraモデルページ お問い合わせ GLM 5.2モデルページ お問い合わせ 料金について



