Casa Blog

Como fazer AI Lip Sync Vídeos de uma foto e um clipe de voz

Modelo de sincronização de lábios em EmpirioLabs

Jun 16, 2026

EmpirioLabs AI

A sincronização dos lábios transforma um retrato imóvel num vídeo falante. Você dá uma foto de um rosto e um clipe de áudio, e o rosto fala ou canta no tempo com o som, com formas de boca combinando, micro-expressões naturais, e um olhar constante. É a maneira mais rápida de colocar palavras na boca de qualquer um para um explicador, uma voz de personagem, um trecho de música, ou um avatar falante.

O modelo Lip Sync em EmpirioLabs faz isso a partir de um retrato e um clipe de voz. Envie uma foto frontal clara e o áudio que você quer que ele diga, e o modelo renderiza um vídeo falando-cabeça onde os lábios seguem o som. Não há nenhum prompt para escrever. A geração leva cerca de 60 a 180 segundos.

Vê-o em acção

Aqui está uma amostra gerada inteiramente através do modelo Lip Sync em EmpirioLabs, de um retrato sintético e um clipe de voz curto.

Do que precisas

Duas coisas. Um retrato claro, voltado para a frente, com uma face bem iluminada, funciona melhor. E um clipe de voz ou canto em mp3 ou wav. O rosto fala com o que o áudio diz, então uma gravação limpa com pouco ruído de fundo dá o resultado mais nítido. O vídeo terminado corresponde automaticamente ao comprimento do seu áudio, até 15 segundos.

Como fazer vídeos de sincronização labial no EmpirioLabs

Você precisa de uma conta EmpirioLabs com créditos ativos.

Passo 1: Abra o playground

Iniciar sessão em plataforma.empiriolabs.ai e clique Área de reprodução na navegação de topo. O modelo Lip Sync recomenda Wan 2.7 e seleciona para você.

Passo 2: Abra o seletor de modelos

Clique na Modelos botão no canto superior esquerdo do parque infantil. Cada efeito criativo se abre em um modal. Filtro pelo Retrato categoria para encontrar Lip Sync rapidamente, ou digite o nome na barra de pesquisa.

Passo 3: Adicione uma foto facial e um clipe de voz

Clique no cartão Lip Sync para aplicá-lo. O compositor então pede dois uploads: primeiro uma foto facial, depois um clipe de voz ou áudio. Adicione ambos, e o botão Gerar liga. Não há prompt de texto, porque o áudio é o script.

Passo 4: Gerar

Acertar GerarAs sondagens do parque infantil para o resultado. O clipe falante cai em linha com um botão de download e um link compartilhável de 7 dias. Troque o áudio para fazer o mesmo rosto dizer algo novo, ou troque a foto para dar à mesma voz um rosto diferente.

Usando o modelo Lip Sync através da API

O mesmo efeito é executado por qualquer cliente compatível com OpenAI. Passar modelo: "lip-sync" sobre uma norma POST /v1/videos/generations chamada com uma imagem e um áudio URL. EmpirioLabs escolhe o modelo recomendado e aplica o efeito:

curl https://api.empiriolabs.ai/v1/videos/generations \ -H "Autorização: Carregador $EMPIRIOLABS API KEY" \ -H "Tipo de Conteúdo: application/json " \ -d '{"template": "lip-sync", "imagem": " https://your-portrait.jpg", "audio": " https://your-voice.mp3"}'

O endpoint retorna a job id imediatamente e a poll url você pode clicar até que o vídeo esteja pronto. O pedido completo e forma de resposta vive no Documentos de Modelos de Geração.

Preços

Lip Sync contas por segundo de vídeo gerado na taxa de vídeo padrão do modelo recomendado, então um curto clipe custa apenas alguns centavos. Você só paga por gerações bem sucedidas, assim não são cobrados empregos fracassados ou recusados. Preço total para cada modelo vive no público página de preços.

Tente sincronizar os lábios agora

O modelo Lip Sync é ao vivo para cada cliente EmpirioLabs. Assinar em plataforma.empiriolabs.ai, abrir o parque infantil, e enviar a sua primeira cabeça falante em alguns minutos. Se você quiser construí-lo em um produto, o mesmo efeito é executado a partir da API com um único campo em uma chamada padrão de geração de vídeo.

Navegar por todos os modelosAbrir o parque infantilLer os documentos dos Modelos de Geração

Pronto para usar endpoints melhores?

Explore nossos modelos ou entre em contato conosco para consultas de negócios, implantações personalizadas ou qualquer outra coisa.