
Kling 3.0 Turbo
Kling AIالتحويل إلى نص إلى فيديو image-to-video مع صوت أصلي متزامن، بدقة 720p أو 1080p لمدة 3 إلى 15 ثانية، مع نسبة العرض إلى الارتفاع والتحكم في التوجيه.
تصفح الكتالوج الكامل للنماذج عبر النصوص، والصور، والصوت، والفيديو، وثلاثي الأبعاد، والمزيد.
كتالوج النماذج
تصفح النصوص والصور والفيديو والصوت وثلاثي الأبعاد، والبحث، ونقاط نهاية الوكلاء بأسعار pay-as-you-go. يقوم الكتالوج التفاعلي بتحميل التوفر الحالي من EmpirioLabs، وهذه المستندات النموذجية قابلة للزحف بدون جافا سكريبت من العميل.
image-to-video xAI بحركة موجهة بالطلب، وصوت أصلي، ومخرج 480p أو 720p، ومقاطع تصل إلى 15 ثانية.
توليد الفيديو متعدد الوسائط للمقاطع السينمائية من مدخلات نصية أو صورة أو صوت أو فيديو.
توليد وتحرير موحد للصور لصور إبداعية عالية الدقة وعلامات تجارية ومنتجات.
نموذج لغة رؤية فعال من حيث التكلفة للنصوص، والصور، والفيديو، والبرمجة، والأدوات، وسير العمل في سياق 1M.
نموذج رائد طويل السياق للبرمجة، والإنتاجية، والوكلاء المستمرين على الطويل، والتفكير العميق، واستخدام الأدوات.
التفكير متعدد الوسائط للبرمجة، والوكلاء، وتحليل السياق الطويل، ومدخلات النصوص والصور والفيديو.
التفكير المتعدد الوسائط من Moonshot مع دعم قوي للبرمجة، وسياق 256K، وإدخال الصور والفيديو.
التفكير طويل السياق مع استدعاء الأدوات، الإخراج الهيكلي، دعم ذاكرة التخزين المؤقت، وإخراج 128K.
توليد الصورة إلى ثلاثي الأبعاد يحول صورة مرجعية إلى أصل GLB ملمس.

Kling AIالتحويل إلى نص إلى فيديو image-to-video مع صوت أصلي متزامن، بدقة 720p أو 1080p لمدة 3 إلى 15 ثانية، مع نسبة العرض إلى الارتفاع والتحكم في التوجيه.

Z.aiنموذج التفكير والترميز مع سياق رمز بحجم 1 مليون، مخرج 128K، جهد التفكير القابل للتعديل، البحث الأصلي على الويب، واستدعاء الأدوات.

Moonshot AIKimi K2.7 Code هو نموذج الترميز الوكيل من Moonshot الذي يضم تريليون معاملات، مع سياق 256 كيلوبايت، وتفكير دائم التشغيل، ومدخلات نصية وصورة وفيديو.

Alibaba Cloudنموذج لغة رؤية فعال من حيث التكلفة في Qwen3.7 للنصوص، والصور، والفيديو، والترميز، واستخدام الأدوات، وفهم واجهة المستخدم الرسومية، وسير عمل السياق 1M.

Moonshot AIKimi K2.7 Code Highspeed هو المستوى الأسرع خدمة في نموذج الترميز الوكيل من Moonshot، مع سياق 256K، وتفكير دائم التشغيل، وإدخال الصور والفيديو.

MiniMaxميني ماكس M3 هو نموذج استدلالي متعدد الوسائط للبرمجة، والوكلاء، وتحليل السياق الطويل باستخدام إدخال النصوص والصور والفيديو.

Z.aiنموذج التفكير والترميز مع سياق رمز بحجم 1 مليون، مخرج 128K، جهد التفكير القابل للتعديل، البحث الأصلي على الويب، واستدعاء الأدوات.

Moonshot AIKimi K2.7 Code هو نموذج الترميز الوكيل من Moonshot الذي يضم تريليون معاملات، مع سياق 256 كيلوبايت، وتفكير دائم التشغيل، ومدخلات نصية وصورة وفيديو.

Alibaba Cloudنموذج لغة رؤية فعال من حيث التكلفة في Qwen3.7 للنصوص، والصور، والفيديو، والترميز، واستخدام الأدوات، وفهم واجهة المستخدم الرسومية، وسير عمل السياق 1M.

Moonshot AIKimi K2.7 Code Highspeed هو المستوى الأسرع خدمة في نموذج الترميز الوكيل من Moonshot، مع سياق 256K، وتفكير دائم التشغيل، وإدخال الصور والفيديو.

MiniMaxميني ماكس M3 هو نموذج استدلالي متعدد الوسائط للبرمجة، والوكلاء، وتحليل السياق الطويل باستخدام إدخال النصوص والصور والفيديو.

Alibaba CloudQwen3.7 Max هو نموذج نصي رائد للبرمجة، والإنتاجية، والوكلاء المستمرين على قيد الحياة، والتفكير العميق، والأدوات، وسياق الرمز بمليون واحد.

Black Forest Labsنموذج 4B FLUX.2 Klein لتوليد وتحرير الصور مرخص من Apache مع دعم text-to-image وتحرير الصور المرجعية وسير العمل الإبداعي.

Amazonإنشاء الصور وتحريرها في نموذج إنشاء وتعديل الصور من مدخلات نصية أو صورية، مع التحكم في الرسم الداخلي، والتجربة الافتراضية، والتحكم في الأسلوب.

Tencentنموذج text-to-image مفتوح المصدر على بنية متعددة الوسائط مزيج من الخبراء مع تفاصيل فوتوغرافية واقعية وعرض نصوص قوي متعدد اللغات.

DeepSeekإطار عمل ذاتي الانحدار على نموذج Janus Pro 7B الذي يوحد الفهم متعدد الوسائط وتوليد الصور في بنية واحدة.

Alibaba Cloudنموذج موحد لتوليد وتحرير الصور مع عرض نص معقد Chinese/English رائد الفئة، وقوام واقعي، ودمج صور متعددة.

ByteDanceنموذج صورة متعدد الوسائط موحد يستعرض التعليمات قبل العرض، مما ينتج تعديلات عالية الدقة ومتسقة ورسومات للعلامة التجارية.

Kling AIالتحويل إلى نص إلى فيديو image-to-video مع صوت أصلي متزامن، بدقة 720p أو 1080p لمدة 3 إلى 15 ثانية، مع نسبة العرض إلى الارتفاع والتحكم في التوجيه.

Amazonنموذج توليد الفيديو ينتج فيديوهات متعددة اللقطات تصل إلى دقيقتين من النص وتوجيهات الصور الاختيارية مع جودة وثبات محسنين.

Alibaba Cloudنموذج الفيديو يقدم أوضاع تحويل النص إلى فيديو، الصورة إلى فيديو، المرجع إلى الفيديو، وتحرير الفيديو مع إخراج عالي الدقة وسلس الحركة.

Tencentنموذج فيديو بمعاملة 8.3 مليار مع إخراج أصلي 720p (قابل للترقية إلى 1080p)، وتماسك حركتي قوي، وفهم للأوامر ثنائية اللغة حتى 10 ثوان.

Kling AIنموذج الفيديو في أوضاع Standard أو Pro مع التحويل من النص إلى الفيديو، الصورة إلى الفيديو، المرجع إلى الفيديو، التحرير، الصوت الأصلي، والانتقالات متعددة المشاهد.

Kling AIنموذج Kling 3.0 الذي ينقل الحركة من فيديو مرجعي إلى شخصية من صورة مرجعية، مع مستويات قياسية 720p وPro 1080p.

ACE-Stepنموذج إنتاج الموسيقى مفتوح المصدر للصوت text-to-song والصوت الموجه بالكلمات، مع استنتاج سريع XL Turbo بثماني خطوات لتكرار الأغنية القابل للتحكم فيه.

Inworldتوليف صوتي TTFB بسرعة أقل من 130 مللي ثانية مع 271+ صوتا عبر 15 لغة، وعرض تعبيري، وبث SSE في الوقت الحقيقي لوكلاء الصوت منخفضي التأخير.

Inworldتوليف صوتي بجودة البث مع غنية تعبيرية، 271+ صوتا عبر 15 لغة، وبث SSE في الوقت الحقيقي مع طوابع زمنية لكل كلمة.

Googletext-to-speech منخفض التأخير مع أصوات مكبرات صوت واحدة ومتعددة وأسلوب ولهجة ونبرة تعبيرية قابلة للتحكم في تطبيقات الإنتاج.

Googleمعاينة TTS عالية الجودة للبودكاست، والكتب الصوتية، ودعم العملاء، مع أصوات معبرة متعددة مكبرات الصوت عبر 23+ لغة.

GoogleTTS قابل للتحكم بدرجة عالية مع علامات صوتية جديدة لأسلوب دقيق، ونبرة، وسرعة، وأداء عبر السرد والمساعدين وتطبيقات الصوت.

Deepgramنسخ الكلام إلى نص باستخدام نموذج Nova-3 مع دعم متعدد اللغات وإعدادات متقدمة قابلة للتخصيص لأعباء العمل الإنتاجية.

OpenAIكان Whisper-1 speech-to-text النسخ، مدربا على صوت متعدد اللغات تحت إشراف، مع حد رفع 25 ميجابايت لكل ملف.

OpenAIتم التحكم في نسخ Whisper Large v3 Turbo المستضاف ذاتيا مع كشف ASR متعدد اللغات، والترجمة، وVAD، والطوابع الزمنية، والترجمة، والكلمات الساخنة، وأدوات فك الترميز.

Exaإجابة سريعة على طريقة نموذج اللغة الكبيرة على سؤال بلغة طبيعية، مستندة إلى نتائج بحث Exa الجديدة على الويب مع استشهادات وروابط مصادر.

Exaمهمة بحثية غير متزامنة تستكشف الويب، وتجمع المصادر، وتجمع النتائج، وتعيد الإجابات المستشهد بها لاستعلامات معمقة.

Exaمحرك بحث ويب للعثور على الصفحات، واسترجاع الصفحات المشابهة، والزحف، والبحث المخصص في الكود عبر الويب المفتوح لعملاء الذكاء الاصطناعي.

Linkupبحث ذكاء اصطناعي تكراري يستمر في الاستعلام عندما تكون النتائج الأولية غير كافية، مما يعيد إجابات أكثر شمولا من الوضع القياسي.

Linkupبحث ويب مدعوم بالذكاء الاصطناعي مع نظرة عامة وإجابات مفصلة أسرع من البحث العميق. يحتل المرتبة #1 في اختبار OpenAI SimpleQA.

Perplexityبحث مؤسسي مدعوم بمنطق كلود أوبوس 4.6، مع أقصى عمق، وتحسين الوصول إلى الأدوات، وتغطية واسعة للمصادر.

Microsoftنموذج TRELLIS.2 من الصورة إلى ثلاثية الأبعاد يحول صورة مرجعية إلى أصل GLB مملموس مع دقة، وبذرة، وشبكة، وملمس، وتحكم في التصدير.

Alibaba Cloudتضمين نص متعدد اللغات مع أبعاد إخراج قابلة للاختيار (64–2048). حتى 8,192 رمزا لكل إدخال.

Alibaba Cloudتضمين متعدد الوسائط محسن للسرعة — بنفس شكل Vision-Plus، 3× رموز image/video أرخص.

Alibaba Cloudالتضمين متعدد الوسائط ينتج متجهات مستقلة لمدخلات النص والصورة والفيديو.

Alibaba Cloudإعادة ترتيب المستندات الدلالية. يرتب حتى 500 مرشح لكل استعلام حسب الصلة، ويدعم 100+ لغة، ويقبل تعليمات فرز مخصصة.

GPTZeroكاشف التعلم العميق الذي يحدد أجزاء من النص التي من المحتمل أن يكون مولدا بواسطة الذكاء الاصطناعي مقابل الإنسان، ويصنف المحتوى إلى إنسان بالكامل، أو ذكاء اصطناعي، أو مختلط.

Manusوكيل ذكاء اصطناعي مستقل يحول تنبيها عالي المستوى إلى مهام فرعية، يستدعي الأدوات وواجهات برمجة التطبيقات، ويحقق نتائج end-to-end دون تنسيق يدوي.
استكشف نماذجنا، أو تواصل معنا بشأن استفسارات الأعمال، أو النشر المخصص، أو أي شيء آخر.