Découvrez notre production prête Modèles d’IA

Parcourez le catalogue complet des modèles: texte, image, audio, vidéo, 3D et plus encore.

Catalogue de modèles

Des modèles d’IA sur une API compatible OpenAI.

Parcourez les points de terminaison texte, image, vidéo, audio, 3D, recherche et agents avec pay-as-you-go prix. Le catalogue interactif charge la disponibilité actuelle d’EmpirioLabs, et ces documents modèles sont accessibles sans JavaScript client.

Documents du modèle ouvert

New & Featured

Endpoint propriétaireNouveau

Text-to-video et image-to-video avec audio natif synchronisé, à 720p ou 1080p pendant 3 à 15 secondes, avec rapport d'aspect et contrôle rapide.

Publié Jun 17, 2026
Save up to 21%
Endpoint propriétaireNouveau

Modèle de raisonnement et de codage avec un contexte de jeton 1M, sortie 128K, effort de raisonnement réglable, recherche web native, et appel d'outils.

SingaporePublié Jun 16, 20261M contexte
GermanyPublié Jun 16, 20261M contexte
Save up to 7%

Kimi K2.7 Code

Moonshot AI
Endpoint propriétaireNouveau

Kimi K2.7 Le code est le modèle de codage agentique par trillion de Moonshot avec un contexte 256K, toujours sur le raisonnement et des entrées texte, image et vidéo.

Publié Jun 16, 2026256K contexte
GermanyPublié Jun 16, 2026256K contexte
Save up to 31%

Qwen3.7 Plus

Alibaba Cloud
Endpoint propriétaireNouveau

Modèle de langage de vision Qwen3.7 rentable pour le texte, l'image, la vidéo, le codage, l'utilisation d'outils, la compréhension de l'interface graphique et les flux de travail 1M-context.

SingaporePublié Jun 1, 20261M contexte
ChinaPublié Jun 1, 20261M contexte
Endpoint propriétaireNouveau

Kimi K2.7 Code Highspeed est le niveau de service plus rapide du modèle de codage agentique de Moonshot, avec un contexte 256K, un raisonnement toujours en cours, et une entrée image et vidéo.

Publié Jun 16, 2026256K contexte
Save up to 25%

MiniMax M3

MiniMax
Endpoint propriétaireNouveau

MiniMax M3 est un modèle de raisonnement multimodal pour le codage, les agents et l'analyse de long-contexte avec entrée texte, image et vidéo.

SingaporePublié Jun 1, 2026524K contexte

Génération de texte55

Save up to 21%
Endpoint propriétaireNouveau

Modèle de raisonnement et de codage avec un contexte de jeton 1M, sortie 128K, effort de raisonnement réglable, recherche web native, et appel d'outils.

SingaporePublié Jun 16, 20261M contexte
GermanyPublié Jun 16, 20261M contexte
Save up to 7%

Kimi K2.7 Code

Moonshot AI
Endpoint propriétaireNouveau

Kimi K2.7 Le code est le modèle de codage agentique par trillion de Moonshot avec un contexte 256K, toujours sur le raisonnement et des entrées texte, image et vidéo.

Publié Jun 16, 2026256K contexte
GermanyPublié Jun 16, 2026256K contexte
Save up to 31%

Qwen3.7 Plus

Alibaba Cloud
Endpoint propriétaireNouveau

Modèle de langage de vision Qwen3.7 rentable pour le texte, l'image, la vidéo, le codage, l'utilisation d'outils, la compréhension de l'interface graphique et les flux de travail 1M-context.

SingaporePublié Jun 1, 20261M contexte
ChinaPublié Jun 1, 20261M contexte
Endpoint propriétaireNouveau

Kimi K2.7 Code Highspeed est le niveau de service plus rapide du modèle de codage agentique de Moonshot, avec un contexte 256K, un raisonnement toujours en cours, et une entrée image et vidéo.

Publié Jun 16, 2026256K contexte
Save up to 25%

MiniMax M3

MiniMax
Endpoint propriétaireNouveau

MiniMax M3 est un modèle de raisonnement multimodal pour le codage, les agents et l'analyse de long-contexte avec entrée texte, image et vidéo.

SingaporePublié Jun 1, 2026524K contexte
Save up to 34%

Qwen3.7 Max

Alibaba Cloud
Endpoint propriétaireNouveau

Qwen3.7 Max est un modèle de texte phare pour le codage, la productivité, les agents de longue durée, la pensée profonde, les outils et le contexte de jeton 1M.

SingaporePublié May 21, 20261M contexte
ChinaPublié May 21, 20261M contexte

Génération d'images7

Save up to 39%

FLUX.2 Klein 4B

Black Forest Labs
Inférence nativeNouveau

Licence Apache 4B FLUX.2 Modèle de génération et d'édition d'images Klein avec text-to-image, édition d'images de référence et support créatif du workflow.

Publié Jan 15, 2026
Endpoint propriétaire

Génération d'images et édition de modèles créant et modifiant des images à partir d'entrées de texte ou d'image, avec inpeinture, essai virtuel et contrôles de style.

Publié Dec 3, 2024
Endpoint propriétaire

Open-source text-to-image modèle sur une architecture multimodale Mixture-of-Experts avec des détails photoréalistes et un rendu multilingue fort.

Publié Sep 28, 2025
Endpoint propriétaire

Cadre autorégressif sur le modèle Janus Pro 7B qui unifie la compréhension multimodale et la génération d'images dans une architecture.

Publié Jan 27, 2025
Save up to 8%

Qwen Image 2.0

Alibaba Cloud
Endpoint propriétaire

Modèle de génération et d'édition d'images unifiées avec un complexe de classe Chinese/English, des textures réalistes et une fusion multi-images.

SingaporePublié Mar 3, 2026
Endpoint propriétaireNouveau

Modèle d'image multimodale unifiée qui raisonne par l'intermédiaire d'invites avant le rendu, produisant des modifications à haute résolution et cohérentes et des visuels de marque.

MalaysiaPublié Feb 13, 2026

Génération de vidéos15

Endpoint propriétaireNouveau

Text-to-video et image-to-video avec audio natif synchronisé, à 720p ou 1080p pendant 3 à 15 secondes, avec rapport d'aspect et contrôle rapide.

Publié Jun 17, 2026
Endpoint propriétaire

Modèle de génération vidéo produisant jusqu'à 2 minutes de vidéos multi-captures à partir de texte et d'invites d'image optionnelles avec une qualité et une cohérence améliorées.

Publié Apr 7, 2025

HappyHorse 1.0

Alibaba Cloud
Endpoint propriétaireNouveau

Modèle vidéo offrant des modes Text-to-Video, Image-to-Video, Reference-to-Video et Video Edit avec une sortie haute fidélité, motion-smooth.

SingaporePublié May 6, 2026
Save up to 19%
Inférence native

Modèle vidéo de 8.3B-paramètre avec sortie native 720p (upcalable à 1080p), forte cohérence des mouvements et compréhension rapide bilingue jusqu'à 10s.

Publié Nov 20, 2025

Kling O3

Kling AI
Endpoint propriétaire

Modèle vidéo en mode Standard ou Pro avec transitions Text-to-Video, Image-to-Video, Reference-to-Video, édit, son natif et multi-scène.

Publié Feb 5, 2026
Endpoint propriétaire

Modèle Kling 3.0 qui transfère le mouvement d'une vidéo de référence sur un personnage d'une image de référence, avec les niveaux Standard 720p et Pro 1080p.

Production audio10

Save up to 17%
Inférence nativeNouveau

Modèle de génération de musique Open-source pour text-to-song et audio lyrique-guided, avec inférence XL Turbo à 8 étapes rapides pour l'itération de chansons contrôlables.

Publié Apr 2, 2026
Save up to 30%
Endpoint propriétaireNouveau

Sous-130ms TTFB synthèse vocale avec 271+ voix dans 15 langues, prosody expressive, et en temps réel SSE streaming pour les agents de voix à faible latence.

Publié May 5, 2026
Save up to 15%
Endpoint propriétaireNouveau

Synthèse vocale de qualité radiodiffusée avec prosody expressive riche, 271+ voix dans 15 langues, et diffusion SSE en temps réel avec horodatage par mot.

Publié May 5, 2026
Endpoint propriétaire

Faible latence text-to-speech avec voix mono- et multi-parleurs et style contrôlable, accent et ton expressif pour les applications de production.

Publié May 20, 2025
Endpoint propriétaire

Prévisualisation TTS de haute qualité pour les podcasts, les livres audio et le support client, avec voix expressives multi-parleurs dans plus de 23 langues.

Publié May 20, 2025
Endpoint propriétaireNouveau

TTS hautement contrôlable avec de nouveaux Tags audio pour un style, un ton, un rythme précis et une livraison à travers la narration, les assistants et les applications vocales.

Publié Apr 13, 2026

Transcription3

Endpoint propriétaire

Transcription de la parole au texte en utilisant le modèle Nova-3 avec un support multilingue et des paramètres personnalisables avancés pour les charges de production.

Publié Feb 12, 2025
Endpoint propriétaire

Whisper-1 speech-to-text transcription formée sur audio supervisé multilingue, avec une limite de téléchargement de 25 Mo par fichier.

Publié Sep 21, 2022
Save up to 17%
Inférence nativeNouveau

Whisper Large v3 Turbo à transcription contrôlée avec ASR multilingue, traduction, VAD, horodatage, sous-titres, mots chauds et contrôles décodeur exposés.

Publié Oct 1, 2024

Recherche et recherche14

Endpoint propriétaire

Réponse rapide de style LLM à une question en langage naturel, fondée sur des résultats de recherche récents sur le Web Exa avec des citations en ligne et des liens sources.

Endpoint propriétaire

Tâche de recherche asynchrone qui explore le Web, recueille les sources, synthétise les résultats et renvoie les réponses citées pour des questions approfondies.

Endpoint propriétaire

Recherche en ligne alimentée par l'IA avec des aperçus détaillés et des réponses, plus rapidement que la recherche profonde. Classement 1 sur OpenAI SimpleQA benchmark.

100K contexte
Endpoint propriétaire

Recherche de niveau institutionnel alimentée par le raisonnement de Claude Opus 4.6, avec une profondeur maximale, un accès amélioré aux outils et une couverture étendue des sources.

Création 3D1

Save up to 90%

TRELLIS.2 4B

Microsoft
Inférence nativeNouveau

TRELLIS.2 modèle image à 3D qui transforme une image de référence en un actif GLB texturé avec résolution, graine, maillage, texture et contrôles d'exportation.

Assemblages3

Text Embedding v4

Alibaba Cloud
Endpoint propriétaireNouveau

Intégration multilingue du texte avec des dimensions de sortie sélectionnables (64-2048). Jusqu'à 8 192 jetons par entrée.

SingaporePublié Jun 4, 20258192 contexte
Endpoint propriétaireNouveau

Intégration multimodale optimisée de vitesse - même forme que Vision-Plus, 3× moins cher image/video jetons.

SingaporePublié Sep 23, 20251024 contexte
Endpoint propriétaireNouveau

Intégration multimodale produisant des vecteurs indépendants pour les entrées texte, image et vidéo.

SingaporePublié Sep 23, 20251024 contexte

Reclasseurs1

Qwen3 Rerank

Alibaba Cloud
Endpoint propriétaireNouveau

Document sémantique reclassé. Trie jusqu'à 500 candidats par question par pertinence, prend en charge plus de 100 langues, et accepte une instruction de tri personnalisée.

SingaporePublié Jun 5, 20254000 contexte

Outils et agents2

GPTZero

GPTZero
Endpoint propriétaire

Détecteur d'apprentissage profond qui annonce des portions de texte probablement générées par l'IA par rapport à l'humain, classant le contenu comme entièrement humain, l'IA ou mixte.

Manus

Manus
Endpoint propriétaire

Agent d'IA autonome qui transforme une prompte de haut niveau en sous-tâches, appels d'outils et API, et délivre des résultats end-to-end sans orchestration manuelle.

Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.
Aucun objet trouvé.

Prêt à utiliser de meilleurs points de terminaison ?

Explorez nos modèles, ou contactez-nous pour toute demande d’entreprise, des déploiements personnalisés ou pour tout autre sujet.