우리는 두 개의 프론티어 모델에게 똑같은 다섯 가지 코딩 프롬프트를 주고 각자가 만든 것을 기록했습니다. 편집도, 재시도도, 골라내는 것도 없습니다. 푸구 울트라 사카나 AI에서 왔으며, GLM 5.2 Z.ai 에서 각각 자체 플레이 소행성, 자동 재생 퐁, 플라즈마 필드, 웜홀 터널, 하이퍼스페이스 스타필드를 작성했으며, 모두 라이브러리 없는 단일 독립형 HTML 파일이었습니다. 두 모델 모두 하나의 OpenAI 호환 API 뒤에서 EmpirioLabs 실행되어, 모델 이름만 바꿔간 하나의 요청 몸체였습니다.
다섯 번의 테스트 경기 모두 시청하세요
우리가 진행한 방법
각 프롬프트는 각 모델에게 한 번의 사용자 메시지로 전달되었고, 우리는 수정 없이 그대로 렌더링했습니다. 두 게임 모두 추론 노력을 최대치로 설정했습니다. Fugu Ultra는 항상 사고를 실행하며, GLM 5.2는 최고의 이성적 노력을 펼쳤습니다. 온도 오버라이드도 없고 시스템 알림도 없었습니다. 최대 출력은 32,000 토큰이었습니다. 모든 프롬프트는 모든 CSS와 자바스크립트가 인라인에 포함된 단일 독립형 HTML 파일을 요구했고, 외부 라이브러리, CDN 링크, 가져오기 기능이 없었습니다.
결과
두 모델 모두 첫 시도에서 다섯 개의 프롬프트 모두에서 작동하는 코드를 반환했습니다. 각 답변의 크기를 최종 HTML 파일의 라인 단위로 측정한 것입니다.
| 테스트 | 푸구 울트라 | GLM 5.2 |
|---|---|---|
| 셀프 플레이 소행성 | 948회 | 656개 라인 |
| 셀프 플레이 퐁 | 486개 라인 | 412 라인 |
| 플라즈마장 | 298 라인 | 131개 라인 |
| 웜홀 터널 | 255개 라인 | 199개 라인 |
| 초공간 스타필드 | 241개 라인 | 166개 라인 |
우리가 알아차린 점
두 모델은 내부적으로 매우 다르게 작동하며, 테스트에서도 그 차이가 드러납니다. Fugu Ultra는 다중 에이전트 오케스트레이션 모델로, 응답하기 전에 여러 차례 내부 추론 패스를 실행하기 때문에 작업당 훨씬 더 오래 걸리고 과정 중에 훨씬 더 많은 추론을 생성했습니다. 또한 모든 프롬프트에 더 많은 코드 줄을 작성했습니다. GLM 5.2는 1M 토큰 컨텍스트 윈도우를 가진 빠른 단일 패스 모델로, 훨씬 짧은 시간 내에 더 좁은 파일을 반환했습니다. 어느 쪽도 승자가 아니다. 각 작업은 다양한 용도로 만들어졌고, 요청당 최대 깊이를 원할지, 속도와 양을 원하는지에 따라 선택이 달라집니다.
우리는 일부러 우승자를 선정하는 것이 아닙니다. 클립을 보고 각 렌더링이 어떻게 보이고 동작하는지 확인한 뒤, 본인의 사용 사례에 맞게 판단하세요.
직접 같은 검사를 해보세요
두 모델 모두 OpenAI 호환 채팅 완성 API를 지원하기 때문에, 전환은 한 줄만 가능합니다. 요점 base_url at https://api.empiriolabs.ai/v1 에 모델 ID를 다음과 같이 설정했습니다. 푸구-울트라 또는 glm-5-2 에·.
curl https://api.empiriolabs.ai/v1/chat/completions \ -h "권한: 베어러 $EMPIRIOLABS_API_KEY" \ -h "콘텐츠-타입: application/json" \ -d '{ "model": "fugu-ultra", "messages": [{"role": "user", "content": "라이브러리 없이 단일 HTML 파일로 셀프 플레이용 Asteroids 게임을 구축하세요."}}}'
변화 "모델": "푸구-울트라" 로 "모델": "glm-5-2" 그리고 다시 실행하세요. 그게 바로 EmpirioLabs의 핵심입니다: 모든 프론티어 모델을 하나의 API 뒤에 두어, 별도의 연결 없이 직접 프롬프트에서 비교할 수 있게 하는 것입니다. 또한 두 가지 모두를 나란히 사용할 수도 있습니다. 뚱 베어·.
자주 묻는 질문
어떤 모델들이 테스트되었나요?
Sakana AI의 Fugu Ultra와 Z.ai 의 GLM 5.2가 모두 하나의 OpenAI 호환 API를 통해 EmpirioLabs에서 이용 가능합니다.
다섯 가지 코딩 과제는 무엇이었나요?
셀프 플레이 아스테로이드 게임, 셀프 플레이 퐁 게임, 데모씬 플라즈마 효과, 무한 웜홀 터널, 그리고 하이퍼스페이스 스타필드 워프. 각 파일은 외부 라이브러리가 없는 단일 독립형 HTML 파일이어야 했습니다.
편집하거나 재시도한 부분이 있나요?
아니. 각 모델은 프롬프트당 한 번씩 샷을 받았고, 우리는 반환된 대로 렌더링했습니다. 결과가 멋지든 아니든 우리는 그 결과를 유지했습니다.
왜 Fugu Ultra는 더 오래 걸리나요?
Fugu Ultra는 항상 온(on-on) 추론을 가진 다중 에이전트 오케스트레이션 모델입니다. 응답 전에 여러 차례 내부 검사를 하는데, 이는 속도를 대신 깊이를 대가로 치른다. GLM 5.2는 한 번에 답변합니다.
두 모델 사이를 어떻게 전환하나요?
한 줄만 바꿔. 두 프로그램 모두 OpenAI 채팅 완료 API를 제공합니다. https://api.empiriolabs.ai/v1 에모델 ID를 다음과 같이 설정하세요 푸구-울트라 또는 glm-5-2 에 그리고 나머지는 모두 그대로다.



