上海信弘智能科技有限公司,信弘,智能,信弘智能科技,Elite Partner,Omniverse,智能科技,NVIDIA GPU,NVIDIA DGX, vGPU,TESLA,QUADRO,AI,AI培训,AI课程,人工智能,解决方案,DLI,Mellanox,IB, 深度学习,RTX,IT,ORACLE 数据库,ORACLE云服务,深度学习学院,bigdata,大数据,数据安全备份,鼎甲,高性能计算, 虚拟机,虚拟桌面,虚拟软件,硬件,软件,加速计算,HPC,超算,服务器,虚拟服务器,IT咨询,IT系统规划,应用实施,系统集成

CGC 推荐 3｜一张图，开口说整段台词，AI 让照片“活”过来了！

CGC本周推荐

想让一张静态照片动起来？
想让图片里的角色“开口说话”，且嘴型动作精准匹配语音？

今天，我们带来 NVIDIA 的 Audio2Face-2D，
让一张肖像图 跟着声音“动”起来，轻松生成 真实自然的口型动画。

Audio2Face-2D是什么

NVIDIA Audio2Face-2D是一款基于生成模型的 AI 微服务，可以通过 一张肖像照片 + 一段音频，生成与语音完美同步的 口型动画。通过音频内容识别口腔发音特征，转化为面部运动轨迹，再由生成模型 驱动照片动起来，让静态人物“开口说话”。

FEATURE
功能亮点

Audio-to-Face

Digital Humans

Nvidia Maxine

Speech-to-animation

应用场景

虚拟数字人

让虚拟角色“对口型发言”，打造更加真实可信的交互体验。

AI 视频生成

帮助内容创作者将静态照片变为动态口型视频，节约大量动画制作成本。

无障碍交流

帮助听障人群通过嘴型辅助理解语音内容，增强沟通体验。

语音生成视频

NVIDIA Audio2Face-2D 利用强大的生成模型，将音频输入转化为逼真的口型动画，完美同步语音与嘴部运动。该模型不仅能生成自然的嘴部动作，还能加入如眨眼、眼神转动等表情，使面部动画更加生动真实。

🎬 输入：一张照片 + 任意一段语音

🎥 输出：嘴型与语音完美同步的视频

如何使用

「模型名称」

Audio2Face-2d

📌 使用方式：

> 访问登录 Lichan CGC 平台
> 关键词检索资源 Audio2Face-2d
> 点击【资源下载】下载 NIM 资源
> 或点击【尝鲜试用】在线体验 NIM 服务

立即前往：

📎 https://cgc.chancloud.com/

进入 CGC 平台，亲自体验从一句话、一道线条或一张照片开始，构建属于你的视觉宇宙！

LICHAN CGC

丽蟾 CGC（China GPU Cloud）是面向中国开发者的一站式 AI 微服务资源平台，也是目前唯一获得 NVIDIA NGC 官网跳转链接的中国平台。目前已经同步上线 80+ 海外热门 NVIDIA NIM。

联系客服

扫描二维码

获取更多资讯

与 NVIDIA 产品相关的图片或视频（完整或部分）的版权均归 NVIDIA Corporation 所有

ZENTEK 新闻

CGC 推荐 3｜一张图，开口说整段台词，AI 让照片“活”过来了！