Explora nuestra producción lista Modelos de IA

Explora el catálogo completo de modelos en texto, imagen, audio, vídeo, 3D y más.

Catálogo de modelos

Modelos de IA en una API compatible con OpenAI.

Navega por texto, imagen, vídeo, audio, 3D, búsqueda y endpoints de agentes con precios pay-as-you-go. El catálogo interactivo carga la disponibilidad actual de EmpirioLabs, y estos documentos modelo son rastreables sin JavaScript cliente.

Documentación de modelo abierto

New & Featured

Endpoint propietarioNuevo

Texto a video e imagen a video con audio nativo sincronizado, en 720p o 1080p durante 3 a 15 segundos, con control de relacion de aspecto y prompt.

Lanzado Jun 17, 2026
Save up to 21%
Endpoint propietarioNuevo

Modelo de razonamiento y codigo con contexto de 1M de tokens, salida de 128K, esfuerzo de razonamiento ajustable, busqueda web nativa y llamadas a herramientas.

SingaporeLanzado Jun 16, 20261M contexto
GermanyLanzado Jun 16, 20261M contexto
Save up to 7%

Kimi K2.7 Code

Moonshot AI
Endpoint propietarioNuevo

Kimi K2.7 Code es el modelo de codigo agentico de un billon de parametros de Moonshot, con contexto de 256K, razonamiento siempre activo y entradas de texto, imagen y video.

Lanzado Jun 16, 2026256K contexto
GermanyLanzado Jun 16, 2026256K contexto
Save up to 31%

Qwen3.7 Plus

Alibaba Cloud
Endpoint propietarioNuevo

Modelo de lenguaje de visión rentable Qwen3.7 para texto, imagen, vídeo, codificación, uso de herramientas, comprensión GUI y flujos de trabajo contexto 1M.

SingaporeLanzado Jun 1, 20261M contexto
ChinaLanzado Jun 1, 20261M contexto
Endpoint propietarioNuevo

Kimi K2.7 Code Highspeed es el nivel más rápido del modelo de codificación de Moonshot, con contexto 256K, siempre en el razonamiento, y la entrada de imagen y vídeo.

Lanzado Jun 16, 2026256K contexto
Save up to 25%

MiniMax M3

MiniMax
Endpoint propietarioNuevo

MiniMax M3 es un modelo de razonamiento multimodal para codificación, agentes y análisis de largo contenido con texto, imagen y entrada de vídeo.

SingaporeLanzado Jun 1, 2026524K contexto

Generacion de texto55

Save up to 21%
Endpoint propietarioNuevo

Modelo de razonamiento y codigo con contexto de 1M de tokens, salida de 128K, esfuerzo de razonamiento ajustable, busqueda web nativa y llamadas a herramientas.

SingaporeLanzado Jun 16, 20261M contexto
GermanyLanzado Jun 16, 20261M contexto
Save up to 7%

Kimi K2.7 Code

Moonshot AI
Endpoint propietarioNuevo

Kimi K2.7 Code es el modelo de codigo agentico de un billon de parametros de Moonshot, con contexto de 256K, razonamiento siempre activo y entradas de texto, imagen y video.

Lanzado Jun 16, 2026256K contexto
GermanyLanzado Jun 16, 2026256K contexto
Save up to 31%

Qwen3.7 Plus

Alibaba Cloud
Endpoint propietarioNuevo

Modelo de lenguaje de visión rentable Qwen3.7 para texto, imagen, vídeo, codificación, uso de herramientas, comprensión GUI y flujos de trabajo contexto 1M.

SingaporeLanzado Jun 1, 20261M contexto
ChinaLanzado Jun 1, 20261M contexto
Endpoint propietarioNuevo

Kimi K2.7 Code Highspeed es el nivel más rápido del modelo de codificación de Moonshot, con contexto 256K, siempre en el razonamiento, y la entrada de imagen y vídeo.

Lanzado Jun 16, 2026256K contexto
Save up to 25%

MiniMax M3

MiniMax
Endpoint propietarioNuevo

MiniMax M3 es un modelo de razonamiento multimodal para codificación, agentes y análisis de largo contenido con texto, imagen y entrada de vídeo.

SingaporeLanzado Jun 1, 2026524K contexto
Save up to 34%

Qwen3.7 Max

Alibaba Cloud
Endpoint propietarioNuevo

Qwen3.7 Max es un modelo de texto insignia para codificación, productividad, agentes de larga duración, pensamiento profundo, herramientas y contexto de 1M.

SingaporeLanzado May 21, 20261M contexto
ChinaLanzado May 21, 20261M contexto

Generación de imagen7

Save up to 39%

FLUX.2 Klein 4B

Black Forest Labs
Inferencia nativaNuevo

Apache-licensed 4B FLUX.2 Klein generación de imágenes y modelo de edición con text-to-image, edición de imagen de referencia, y soporte de flujo de trabajo creativo.

Lanzado Jan 15, 2026
Endpoint propietario

Generación de imágenes y modelo de edición creando y modificando imágenes de entrada de texto o imagen, con controles de impresión, virtuales y estilo.

Lanzado Dec 3, 2024
Endpoint propietario

Open-source text-to-image modelo en una arquitectura multimodal Mixture-of-Experts con detalles fotorrealistas y una fuerte reproducción de texto multilingüe.

Lanzado Sep 28, 2025
Endpoint propietario

Marco autoregresivo sobre el modelo Janus Pro 7B que unifica la comprensión multimodal y la generación de imagen en una arquitectura.

Lanzado Jan 27, 2025
Save up to 8%

Qwen Image 2.0

Alibaba Cloud
Endpoint propietario

Modelo de generación y edición de imágenes unificadas con complejo líder en clase Chinese/English renderización de texto, texturas realistas y fusión multiimagen.

SingaporeLanzado Mar 3, 2026
Endpoint propietarioNuevo

Unified multimodal image model that reasons through prompts before rendering, producing high- resolution and consistent edits and brand visuals.

MalaysiaLanzado Feb 13, 2026

Generacion de video15

Endpoint propietarioNuevo

Texto a video e imagen a video con audio nativo sincronizado, en 720p o 1080p durante 3 a 15 segundos, con control de relacion de aspecto y prompt.

Lanzado Jun 17, 2026
Endpoint propietario

Modelo de generación de vídeo que produce hasta 2 minutos vídeos multi-shot de texto y impulsos de imagen opcionales con mejor calidad y consistencia.

Lanzado Apr 7, 2025

HappyHorse 1.0

Alibaba Cloud
Endpoint propietarioNuevo

Modelo de vídeo que ofrece modos Text-to-Video, Image-to-Video, Reference-to-Video y Video Editar con alta fidelidad, salida motriz.

SingaporeLanzado May 6, 2026
Save up to 19%
Inferencia nativa

8.3B-parametro modelo de vídeo con salida nativa 720p (superable a 1080p), fuerte coherencia de movimiento y comprensión bilingüe rápida hasta 10s.

Lanzado Nov 20, 2025

Kling O3

Kling AI
Endpoint propietario

Modelo de vídeo en modos Standard o Pro con transiciones de texto a vídeo, imagen a vídeo, referencia a vídeo, edición, sonido nativo y multiescena.

Lanzado Feb 5, 2026
Endpoint propietario

Modelo Kling 3.0 que transfiere el movimiento de un video de referencia a un personaje de una imagen de referencia, con los niveles Standard 720p y Pro 1080p.

Generación de audio10

Save up to 17%
Inferencia nativaNuevo

Modelo de generación de música de código abierto para text-to-song y audio guiado por letras, con rápida inferencia XL Turbo de 8 pasos para la iteración de canciones controlable.

Lanzado Apr 2, 2026
Save up to 30%
Endpoint propietarioNuevo

Sub-130ms TTFB síntesis de voz con 271+ voces a través de 15 idiomas, prosodio expresivo y streaming SSE en tiempo real para agentes de voz de baja latencia.

Lanzado May 5, 2026
Save up to 15%
Endpoint propietarioNuevo

Sintetización de voz de calidad de radio con rica prosodia expresiva, 271+ voces a través de 15 idiomas, y streaming SSE en tiempo real con temporizadores por palabra.

Lanzado May 5, 2026
Endpoint propietario

Low-latency text-to-speech con voces individuales y multihablantes y estilo controlable, acento y tono expresivo para aplicaciones de producción.

Lanzado May 20, 2025
Endpoint propietario

Avance TTS de alta calidad para podcasts, audiolibros y soporte al cliente, con voces expresivas multihablantes en 23 idiomas.

Lanzado May 20, 2025
Endpoint propietarioNuevo

TTS altamente controlables con nuevas etiquetas de audio para estilo preciso, tono, ritmo y entrega a través de narración, asistentes y aplicaciones de voz.

Lanzado Apr 13, 2026

Transcripción3

Endpoint propietario

Trascripción de discurso a texto utilizando el modelo Nova-3 con soporte multilingüe y ajustes personalizables avanzados para la carga de trabajo de producción.

Lanzado Feb 12, 2025
Endpoint propietario

Whisper-1 speech-to-text transcripción entrenada en audio supervisado multilingüe, con un límite de carga de 25 MB por archivo.

Lanzado Sep 21, 2022
Save up to 17%
Inferencia nativaNuevo

Controlada transcripción de Whisper Large v3 Turbo con ASR multilingüe, traducción, VAD, timetamps, subtítulos, palabras calientes y controles de decodificador expuestos.

Lanzado Oct 1, 2024

Investigación y búsqueda14

Endpoint propietario

Respuesta rápida de estilo LLM a una pregunta de lenguaje natural, basada en resultados de búsqueda web de Exa frescos con citas en línea y enlaces fuente.

Endpoint propietario

Asincrónica tarea de investigación que explora la web, reúne fuentes, sintetiza hallazgos, y devuelve respuestas citadas para consultas profundas.

Endpoint propietario

Búsqueda web impulsada por AI con descripciones detalladas y respuestas, más rápido que búsqueda profunda. Ranks #1 en punto de referencia OpenAI SimpleQA.

100K contexto
Endpoint propietario

Investigación de grado institucional impulsada por el razonamiento Claude Opus 4.6, con máxima profundidad, mayor acceso a herramientas y amplia cobertura de fuente.

3D Generation1

Save up to 90%

TRELLIS.2 4B

Microsoft
Inferencia nativaNuevo

TRELLIS.2 modelo de imagen a 3D que convierte una imagen de referencia en un activo GLB texturado con resolución, semilla, malla, textura y controles de exportación.

Incrustaciones3

Text Embedding v4

Alibaba Cloud
Endpoint propietarioNuevo

Texto multilingüe incrustando con dimensiones de salida seleccionables (64–2048). Hasta 8.192 fichas por entrada.

SingaporeLanzado Jun 4, 20258192 contexto
Endpoint propietarioNuevo

Incrustación multimodal optimizada a la velocidad - la misma forma que Vision-Plus, 3× más barato image/video tokens.

SingaporeLanzado Sep 23, 20251024 contexto
Endpoint propietarioNuevo

Multimodal embedding produciendo vectores independientes para textos, imágenes y entradas de vídeo.

SingaporeLanzado Sep 23, 20251024 contexto

Rerankers1

Qwen3 Rerank

Alibaba Cloud
Endpoint propietarioNuevo

Reranker de documentos semánticos. Ordenar hasta 500 candidatos por consulta por relevancia, admite más de 100 idiomas y acepta una instrucción de clasificación personalizada.

SingaporeLanzado Jun 5, 20254000 contexto

Herramientas y agentes2

GPTZero

GPTZero
Endpoint propietario

Detector de aprendizaje profundo que marca porciones de texto generadas por AI contra humanos, clasificando contenido como totalmente humano, AI o mixto.

Manus

Manus
Endpoint propietario

Agente autónomo de IA que convierte un impulso de alto nivel en subtascos, llama herramientas y APIs, y ofrece resultados end-to-end sin orquestación manual.

No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.
No se han encontrado objetos.

¿Listo para usar mejores endpoints?

Explora nuestros modelos o contáctanos para consultas empresariales, despliegues personalizados o cualquier otra cosa.