EmpirioLabs AI

Prueba de codificación de cuatro vías: Kimi K2.7 Code, DeepSeek V4 Pro, Qwen3.7 Max y GLM 5.2, cada uno generando un juego Breakout auto-reproducido a partir de un único archivo HTML.

Jun 24, 2026

EmpirioLabs AI

Les dimos a cuatro modelos de programación de frontera los mismos tres prompts de juego y les dejamos construir. Sin ediciones, sin repeticiones. Kimi K2.7 Código de Moonshot AI, DeepSeek V4 Pro, Qwen3.7 Max de Alibaba, y GLM 5.2 de Z.ai cada uno escribió un Snake auto-jugable, un Breakout auto-reproducido y un Pong auto-jugable, cada uno un archivo HTML autónomo sin bibliotecas. Los cuatro funcionan en EmpirioLabs detrás de una API compatible con OpenAI.

Mira cómo los cuatro lo construyen

Cómo lo gestionamos

Cada prompt iba a cada modelo como un mensaje de usuario, un solo shot, renderizado exactamente como se devolvía sin editar. El esfuerzo de razonamiento estaba al máximo. No hay anulación de temperatura ni aviso del sistema. La producción máxima era de 32.000 tokens. Cada prompt pedía un juego auto-jugable como un único archivo HTML autónomo con todo CSS y JavaScript en línea, sin bibliotecas externas, sin CDN y sin importaciones.

Los resultados

Los cuatro modelos devolvían un juego de archivo único funcional en cada prompt a la primera. Aquí está el tamaño de cada respuesta, en líneas del archivo HTML final.

Test	Kimi K2.7 Código	DeepSeek V4 Pro	Qwen3.7 Max	GLM 5.2
Serpiente auto-jugada	374 líneas	744 líneas	460 líneas	526 líneas
Revelación auto-jugable	295 líneas	762 líneas	335 líneas	370 líneas
Pong auto-jugable	240 líneas	640 líneas	258 líneas	321 líneas

Lo que hemos notado

Cada modelo lanzaba un juego jugable a la primera, pero llegaban de formas muy diferentes. DeepSeek V4 Pro escribía con diferencia más código en las tres tareas, a menudo más del doble de líneas que las otras. El código Kimi K2.7 era el más conciso. Qwen3.7 Max y GLM 5.2 aterrizaron en medio. Más líneas no son mejores ni peores por sí solas, así que lo que hay que ver es cómo se ve y se juega cada partido en el clip. No estamos nombrando un ganador. Elige el que tenga que ver con el trabajo que te guste.

Haz la misma prueba tú mismo

Los cuatro sirven con la API Chat Completions compatible con OpenAI, por lo que compararlos es un cambio sencillo. Point base_url en https://api.empiriolabs.ai/v1 y establecer el id del modelo.

curl https://api.empiriolabs.ai/v1/chat/completions \ -H "Autorización: Portador $EMPIRIOLABS_API_KEY" \ -H "Tipo-Contenido: application/json" \ -d '{ "modelo": "kimi-k2-7-code", "mensajes": [{"rol": "usuario", "contenido": "Construye un juego de Serpiente auto-jugable como un solo archivo HTML, sin bibliotecas."}] }'

Intercambio "modelo" a deepseek-v4-pro, qwen3-7-max, o glm-5-2 y lo vuelvo a ejecutar. Cada modelo frontera está detrás de la misma API, así que puedes compararlos en tus propias indicaciones sin cambiar tu código. También puedes hacer que los cuatro estén uno al lado del otro en el parque infantil.

Preguntas frecuentes

¿Qué modelos de codificación se probaron?

Código Kimi K2.7 de Moonshot AI, DeepSeek V4 Pro, Qwen3.7 Max de Alibaba y GLM 5.2 de Z.ai. Los cuatro funcionan en EmpirioLabs a través de una API compatible con OpenAI.

¿Cuáles eran las tres pruebas?

Un Snake auto-jugable, un Breakout auto-jugable y un Pong auto-reproducido, cada uno un único archivo HTML autónomo sin bibliotecas externas, que se reproduce solo sin entrada del usuario.

¿Se editó o volvió a intentar algo?

No. Cada modelo tenía una oportunidad por prompt y renderizábamos exactamente lo que devolvía, funcionara o no.

¿Qué modelo escribió más código?

DeepSeek V4 Pro escribió más líneas en las tres tareas, y Kimi K2.7 Code fue la que menos escribió. El número de líneas es solo una medida de tamaño, no de calidad, así que mira el clip para ver cómo se juega cada partida.

¿Cómo cambio entre los modelos?

Cambia una cuerda. Los cuatro sirven a la API de Completación de Chats de OpenAI en https://api.empiriolabs.ai/v1, así que configuras el ID del modelo y mantienes el resto de la petición sin cambios.

Pruébalo

Abrir el parque infantil Silencio Explora todos los modelos Silencio Precios