EmpirioLabs AI

Teste de codificação lado a lado: Fugu Ultra e GLM 5.2 cada um renderizando um efeito plasma a partir de um único arquivo HTML, em EmpirioLabs.

Jun 24, 2026

EmpirioLabs AI

Demos a dois modelos de fronteira exatamente os mesmos cinco prompts de codificação e registramos o que cada um construiu. Sem edições, sem tentativas, sem escolhas a dedo. Fugu Ultra de Sakana AI e GLM 5.2 a partir de Z.ai cada um escreveu um Asteroids autônomo, um Pong auto-jogável, um campo de plasma, um túnel de buraco de minhoca e um campo estelar de hiperespaço, cada um um arquivo HTML autônomo sem bibliotecas. Ambos os modelos rodam em EmpirioLabs atrás de uma API compatível com OpenAI, então este foi um único corpo de solicitação com o nome do modelo trocado.

Assista aos cinco testes

Como administramos

Cada prompt foi enviado para cada modelo como uma mensagem de usuário, um shot, e renderizamos exatamente o que retornou sem nenhuma edição. O esforço de raciocínio estava no máximo para ambos. Fugu Ultra mantém seu pensamento sempre ativo, e GLM 5.2 rodou no seu máximo esforço de raciocínio. Sem override de temperatura e sem aviso do sistema. A produção máxima era de 32.000 tokens. Cada prompt pedia um único arquivo HTML autônomo com todo CSS e JavaScript inline, sem bibliotecas externas, sem links CDN e sem importações.

Os resultados

Ambos os modelos retornaram código funcional em todos os cinco prompts na primeira tentativa. Aqui está o tamanho de cada resposta, medido em linhas do arquivo HTML final.

Teste	Fugu Ultra	GLM 5.2
Asteroides Auto-Jogáveis	948 linhas	656 linhas
Pong de jogo autônomo	486 linhas	412 linhas
Campo de plasma	298 linhas	131 linhas
Túnel buraco de minhoca	255 linhas	199 linhas
Campo estelar do hiperespaço	241 linhas	166 linhas

O que notamos

Os dois modelos funcionam de forma muito diferente por baixo do capô, e o teste mostra isso. Fugu Ultra é um modelo de orquestração multi-agente: executa várias passagens internas de raciocínio antes de responder, então gastava muito mais tempo por tarefa e produzia muito mais raciocínio ao longo do caminho. Também escrevia mais linhas de código em cada prompt. O GLM 5.2 é um modelo rápido de passagem única com uma janela de contexto de token de 1M, e retornava arquivos mais compactos em uma fração do tempo. Nenhuma das abordagens é a vencedora aqui. Eles são feitos para diferentes funções, e a escolha certa depende se você quer máxima profundidade por requisição ou velocidade e volume.

Não estamos nomeando um vencedor de propósito. Assista ao clipe, veja como cada render se apresenta e se comporta, e avalie seu próprio caso de uso.

Faça o mesmo teste você mesmo

Ambos os modelos atendem à API Chat Completions compatível com OpenAI, então alternar entre eles é uma mudança de uma linha. Ponto base_url em https://api.empiriolabs.ai/v1 e definir o id do modelo como fugu-ultra ou glm-5-2.

curl https://api.empiriolabs.ai/v1/chat/completions \ -H "Autorização: Portador $EMPIRIOLABS_API_KEY" \ -H "Tipo-de-Conteúdo: application/json" \ -d '{ "modelo": "fugu-ultra", "mensagens": [{"role": "usuário", "conteúdo": "Construa um jogo Asteroids auto-jogável como um único arquivo HTML, sem bibliotecas."}] }'

Mudança "modelo": "Fugu-Ultra" para "modelo": "glm-5-2" E rodar de novo. Esse é o objetivo da EmpirioLabs: cada modelo de fronteira por trás de uma API, para que você possa compará-los nos seus próprios prompts sem precisar reconfigurar nada. Você também pode rodar ambos lado a lado no playground.

Perguntas frequentes

Quais modelos foram testados?

Fugu Ultra da Sakana AI e GLM 5.2 da Z.ai, ambos disponíveis em EmpirioLabs por meio de uma API compatível com OpenAI.

Quais eram as cinco tarefas de programação?

Um jogo de Asteroids auto-jogável, um jogo de Pong auto-jogável, um efeito de plasma de demoscene, um túnel de buraco de minhoca infinito e um campo estelar de hiperespaço warp. Cada um precisava ser um único arquivo HTML autônomo, sem bibliotecas externas.

Algo foi editado ou retentado?

Não. Cada modelo teve uma foto por prompt e renderizamos exatamente o que ele retornou. Mantivemos o resultado, parecesse ótimo ou não.

Por que o Fugu Ultra demora mais?

Fugu Ultra é um modelo de orquestração multi-agente com raciocínio sempre ligado. Ele executa múltiplas passagens internas antes de responder, o que troca velocidade por profundidade. GLM 5.2 responde em uma única passagem.

Como faço para alternar entre os dois modelos?

Troque uma corda. Ambos atendem à API de Conclusão de Chat do OpenAI em https://api.empiriolabs.ai/v1, então você define o ID do modelo como fugu-ultra ou glm-5-2 E todo o resto permanece igual.

Experimente

Abrir o parque infantil □ Página do modelo Fugu Ultra □ Página do modelo GLM 5.2 □ Preços

Fugu Ultra vs GLM 5.2: Cinco Testes de Codificação Comparados

Assista aos cinco testes

Como administramos

Os resultados

O que notamos

Faça o mesmo teste você mesmo