EmpirioLabs AI

並行してコーディングテスト:Fugu UltraとGLM 5.2がそれぞれ単一のHTMLファイルからプラズマ効果をレンダリングしています。EmpirioLabs。

Jun 24, 2026

EmpirioLabs AI

私たちは2つのフロンティアモデルにまったく同じ5つのコーディングプロンプトを与え、それぞれが作ったものを記録しました。編集もリトライも、チェリーピッキングもなし。フグウルトラサカナAIから GLM 5.2 Z.ai からそれぞれ、自己プレイ型のAsteroids、セルフプレイ型のPong、プラズマフィールド、ワームホールトンネル、ハイパースペーススターフィールドを書き、すべてライブラリのない自己完結型HTMLファイルでした。両方のモデルは1つのOpenAI互換APIの背後でEmpirioLabs上で動作しているため、モデル名を入れ替えた1つのリクエストボディでした。

5試合すべてを見てください

運営方法

各プロンプトは1つのユーザーメッセージとして各モデルに送られ、編集なしで返ってきたものを正確にレンダリングしました。理性の努力は両方とも最大に設定されていました。Fugu Ultraは常に思考を稼働させ、GLM 5.2は最高の理性的な努力で動いていました。温度のオーバーライドもシステムプロンプトもありません。最大出力は32,000トークンでした。すべてのプロンプトは、すべてのCSSとJavaScriptがインラインに入り、外部ライブラリやCDNリンク、インポートなしの単一の自己完結型HTMLファイルを求めていました。

結果

両モデルとも5つのプロンプトすべてで初回の試行で動作するコードを返しました。こちらが各回答のサイズで、最終HTMLファイルの線単位で測定しています。

テスト	フグウルトラ	GLM 5.2
セルフプレイアステロイド	948行	656行
セルフプレイポン	486路線	412路線
プラズマフィールド	298路線	131行
ワームホールトンネル	255路線	199ライン
ハイパースペース・スターフィールド	241行	166行

私たちが気づいたこと

この2つのモデルは内部で非常に異なる動作をしており、テストでそれが示されています。Fugu Ultraはマルチエージェントによるオーケストレーションモデルで、応答前に複数回の内部推論パスを実行するため、1タスクあたりはるかに長い時間を費やし、その過程でより多くの推論を生み出しました。また、プロンプトごとにより多くのコード行を書きました。GLM 5.2は1Mトークンコンテキストウィンドウを持つ高速のシングルパスモデルで、よりコンパクトなファイルを短時間で返すことができました。どちらのアプローチもここでの勝者ではありません。それぞれ異なる作業用に作られており、最適な選択はリクエストごとの最大深度や速度・ボリュームのどちらを望むかによって異なります。

私たちは意図的に勝者を挙げているわけではありません。クリップを見て、それぞれのレンダリングがどのように見え、どのように振る舞い、自分の使い方に合わせて判断してください。

自分で同じテストを行ってください

両モデルともOpenAI互換のチャットコンプリートAPIに対応しているため、切り替えは一言で切り替えられます。ポイント base_url at https://api.empiriolabs.ai/v1 モデルIDを フグウルトラ または お問い合わせお問い合わせ.

curl https://api.empiriolabs.ai/v1/chat/completions \ -H 「認証:ベアラー $EMPIRIOLABS_API_KEY」\ -H 「Content-Type: application/json」 \ -d '{ "model": "fugu-ultra", "messages": [{"role": "user", "content": "Statorids ゲームを単一のHTMLファイルとして構築、ライブラリなし。"}] }''

変化 「モデル」:「フグウルトラ」 から 「モデル」:「glm-5-2」 そしてもう一度実行してください。それがEmpirioLabsの目的です:すべてのフロンティアモデルを1つのAPIで管理し、自分でプロンプト上で比較できるように、何も配線を変えずに済みます。また、両方を並べて使うこともできます。プレイグラウンドお問い合わせ.

よくある質問

どのモデルがテストされましたか?

Sakana AIのFugu Ultraと Z.ai のGLM 5.2は、どちらもOpenAI互換APIを通じてEmpirioLabsで利用可能です。

5つのコーディングタスクは何でしたか?

セルフプレイ型のアステロイドゲーム、セルフプレイ型ポンゲーム、デモシーンのプラズマ効果、無限のワームホールトンネル、そしてハイパースペースのスターフィールドワープ。それぞれは外部ライブラリのない、自己完結型のHTMLファイルでなければなりませんでした。

編集や再挑戦はありましたか?

いいえ。各モデルはプロンプトごとに1ショットずつ割り当てられ、返された通りにレンダリングしました。見た目が良くてもそうでなくても、結果はそのままにしました。

なぜフグウルトラは時間がかかるのですか?

Fugu Ultraは、常にオンな推論を持つマルチエージェントによるオーケストレーションモデルです。応答前に複数回の内部パスを行っており、スピードを犠牲にして深みを得ています。GLM 5.2は一回の回答で解決します。

2つのモデルをどうやって切り替えればいいですか?

弦を一本変えて。両者ともOpenAIチャットコンプリートAPIを提供しています。 https://api.empiriolabs.ai/v1モデルIDをに設定します フグウルトラ または お問い合わせ それ以外はすべて変わらない。

試してみて

遊び場を開くお問い合わせ Fugu Ultraモデルページお問い合わせ GLM 5.2モデルページお問い合わせ料金について

Fugu UltraとGLM 5.2:5つのコーディングテストの比較

5試合すべてを見てください

運営方法

結果

私たちが気づいたこと

自分で同じテストを行ってください