Zuhause Blog

So erstellen Sie AI Lip Sync Videos von einem Foto und einem Voice Clip

Lip Sync Vorlage auf EmpirioLabs

Jun 16, 2026

EmpirioLabs AI

Lip Sync verwandelt ein Standbild in ein sprechendes Video. Sie geben ihm ein Foto von einem Gesicht und einem Audioclip, und das Gesicht spricht oder singt in der Zeit mit dem Klang, mit passenden Mundformen, natürlichen Mikroausdrücken und einem stetigen Blick. Es ist der schnellste weg, um wörter in den mund zu legen, für einen erklärer, einen charakter voiceover, einen musikausschnitt oder einen sprechenden avatar.

Die Lip Sync Vorlage auf EmpirioLabs macht dies aus einem Porträt und einem Sprachclip. Laden Sie ein klares nach vorne gerichtetes Foto und das Audio hoch, das Sie sagen möchten, und das Modell macht ein Talking-Head-Video, in dem die Lippen dem Ton folgen. Es gibt keine Aufforderung zum Schreiben. Die Erzeugung dauert etwa 60 bis 180 Sekunden.

Sehen Sie es in Aktion

Hier ist ein Beispiel, das vollständig durch die Lip Sync-Vorlage auf EmpirioLabs generiert wurde, aus einem synthetischen Porträt und einem kurzen Sprachclip.

Was Sie brauchen

Zwei Dinge. Ein klares, nach vorne gerichtetes Porträt mit einem gut beleuchteten Gesicht, das ungefähr zentriert ist, funktioniert am besten. Und eine stimme oder einen singenden clip in mp3 oder wav. Das Gesicht spricht mit allem, was das Audio sagt, so dass eine saubere Aufnahme mit wenig Hintergrundgeräuschen das schärfste Ergebnis liefert. Das fertige Video entspricht automatisch der Länge Ihres Audios, bis zu 15 Sekunden.

So erstellen Sie Lip Sync Videos auf EmpirioLabs

Sie benötigen ein EmpirioLabs-Konto mit aktiven Credits.

Schritt 1: Öffnen Sie den Spielplatz

Anmelden platform.empiriolabs.ai und klicken Spielplatz in der oberen Navigation. Die Lip Sync Vorlage empfiehlt Wan 2.7 und wählt sie für Sie aus.

Schritt 2: Öffnen Sie den Templates Picker

Klicken Sie Meldebögen knopf in der oberen linken Ecke des Spielplatzes. Jeder kreative Effekt öffnet sich in einem Modal. Filter durch die Porträt kategorie, um Lip Sync schnell zu finden, oder geben Sie den Namen in die Suchleiste ein.

Schritt 3: Fügen Sie ein Gesichtsfoto und einen Sprachclip hinzu

Klicken Sie auf die Lip Sync-Karte, um es anzuwenden. Der Komponist fragt dann nach zwei Uploads: zuerst ein Gesichtsfoto, dann eine Stimme oder einen Audioclip. Fügen Sie beide hinzu und die Schaltfläche Generieren wird aktiviert. Es gibt keine textaufforderung, da das audio das skript ist.

Schritt 4: Generieren

Schlag ErzeugungDie Spielplatzbefragungen für das Ergebnis. Der talking-head-clip landet inline mit einem download-button und einem 7-tage-shareable-link. Tauschen Sie das Audio, damit dasselbe Gesicht etwas Neues sagt, oder tauschen Sie das Foto aus, um derselben Stimme ein anderes Gesicht zu geben.

Verwendung der Lip Sync-Vorlage über die API

Der gleiche Effekt kommt von jedem OpenAI-kompatiblen Client. Pass vorlage: „lip-sync auf einem standard POST /v1/videos/generations anruf mit einem bild und ein audio URL. EmpirioLabs wählt das empfohlene Modell aus und wendet den Effekt an:

curl https://api.empiriolabs.ai/v1/videos/generations \ -H "Authorization: Bearer $EMPIRIOLABS API KEY" \ -H "Content-Type: application/json " \ -d '{"template": "lip-sync", "image": " https://your-portrait.jpg", audio": " https://your-voice.mp3"}' "

Der Endpunkt gibt eine job id sofort und a poll url sie können schlagen, bis das video fertig ist. Die vollständige Anfrage- und Antwortform lebt in der Generation Templates docs.

Preisgestaltung

Lip Sync berechnet pro Sekunde erzeugtes Video mit der Standard-Videorate des empfohlenen Modells, so dass ein kurzer Clip nur wenige Cent kostet. Sie zahlen nur für erfolgreiche Generationen, so dass gescheiterte oder abgelehnte Jobs nicht in Rechnung gestellt werden. Vollpreis für jedes Modell lebt in der Öffentlichkeit preisseite.

Jetzt Lip Sync ausprobieren

Die Lip Sync Vorlage ist live für jeden EmpirioLabs Kunden. Anmelden bei platform.empiriolabs.aiÖffnen Sie den Spielplatz und versenden Sie Ihren ersten Sprechkopf in ein paar Minuten. Wenn sie es in ein produkt einbauen möchten, läuft der gleiche effekt von der api mit einem einzigen feld auf einem standard-video-generation-aufruf.

Durchsuchen Sie alle Templates | Öffnen Sie den Spielplatz | Lesen Sie die Generation Templates Docs

Bereit, bessere Endpunkte zu nutzen?

Entdecken Sie unsere Modelle oder kontaktieren Sie uns bei Geschäftsanfragen, individuellen Deployments oder sonst etwas.