首页 博客

如何从照片和语音剪辑中制作AI Lip同步视频

EmpirioLabs 上的 Lip 同步模板

Jun 16, 2026

EmpirioLabs AI

Lip同步将静态肖像变成说话的视频. 你给它一张脸和音频剪辑的照片, 脸和声音及时说话或唱歌, 相匹配的口形, 自然的微表情, 和稳定的视线。 这是最快的方式,在任何人的嘴里,给一个解释者,一个人物的语音,一个音乐片段,或者一个说话的阿凡达.

EmpirioLabs上的Lip Sync模板从一个肖像和一个语音片段来做这个. 上传一张清晰的前置照片和你想表达的音频,模型会制作一个说话头的视频,其中唇跟随声音. 无法迅速写入 。 一代大约需要60到180秒.

行动上看

以下是一个完全通过EmpirioLabs上的Lip Sync模板生成的样本,来自一个合成肖像和一个短语音片段.

你需要的东西

两件事 一张清晰、正面的肖像画, 有一副精致的长相, 大致以中心为中心, 效果最好。 和在mp3或wav中的声音或唱歌片段. 脸对着音频说的任何内容,所以一个没有背景噪音的干净的录音会给出最尖锐的结果. 完成的视频自动匹配您的音频长度, 最多15秒.

如何在EmpirioLabs上制作唇语同步视频

你需要一个EmpirioLabs的账户 有活跃的信用.

第一步:开放游乐场

签名到 empiriolabs.ai 互联网档案馆的存檔,存档日期2014-09-02 并单击 游戏场 在顶端导航。 唇同步模板推荐Wan 2.7,并为您选择.

步骤2: 打开模板拾取器

单击 模板 按钮在操场左上角。 每一个创造效果都以模式打开. 通过过滤器 纵向 分类以快速查找 Lip Sync,或在搜索栏中键入名称.

步骤 3: 增加一张脸部照片和一张语音剪辑

点击 Lip 同步卡应用它 。 作曲家随后要求两个上传:先是脸部照片,然后是声音或音频剪辑. 两个都加,生成按钮打开. 没有文字提示, 因为音频是脚本.

步骤4:生成

点击 生成现场投票结果 对话片段以下载按钮和7天的可共享链接连载。 交换音频,让同一张脸说些新话,或者换照片让同一张声音换一张不同的脸.

通过 API 使用唇同步模板

同样的效果来自任何OpenAI兼容客户端. 过 模板: “ 剪贴同步 ” 标准 后 /v1/videos/generations 呼叫一个 图像 还有一个 音频 URL (中文(简体)). EmpirioLabs选择推荐的模式并应用效果:

卷 https://api.empiriolabs.ai/v1/videos/generations \-H "授权:熊猫 $EMPRIOLABS API KEY" -H "交响曲: application/json ", ===============================================================================================================================================

结束点返回 a 任务(d) 立即和a 民调url 你可以打,直到视频准备好。 整个请求和反应形成 生成模板文件。 。 。.

定价

Lip Sync账单每秒生成的视频,按推荐模型的标准视频速率计算,因此短片只花费几分钱. 你只为成功的一代付钱, 所以失败或被拒绝的工作是不收费的。 对每个模式的公众生活进行全面定价 定价页面。 。 。.

现在尝试唇同步

Lip Sync模板为EmpirioLabs每位客户直播. 签名于 empiriolabs.ai 互联网档案馆的存檔,存档日期2014-09-02打开游乐场 再过几分钟就把第一个说话的人送上船 如果要将其构建成产品,同样的效果会从API在标准视频生成调用上以单字段进行.

浏览所有模板 | 打开游乐场 | 读取世代模板文件

准备好使用更好的终端了吗?

欢迎浏览我们的模型,或联系我们洽谈业务咨询、定制部署或其他任何事宜。