Shanghai ZENTEK Co., Ltd. ZENTEK 信弘,智能,信弘智能科技 Elite Partner,Omniverse,智能科技 NVIDIA GPU,NVIDIA vGPU,TESLA,QUADRO,AI, AI Training,AI Courses,Artificial Intelligence (AI),Solutions,DLI,Mellanox,InfiniBand (IB),Deep Learning, NVIDIA RTX,IT,RACLE Database,ORACLE Cloud Services,Deep Learning Institute, bigdata,Big Data, Data Security & Backup,鼎甲SCUTECH CORP,High-Performance Computing (HPC),Virtual Machines (VM), Virtual Desktop Infrastructure (VDI),Virtual Desktop Infrastructure (VDI),Hardware,Software, Accelerated Computing,High-Performance Computing (HPC),Supercomputing,Servers,Virtual Servers, IT Consulting,IT System Planning, Application Deployment,System Integration

ZENTEK News

CGC 推荐 3|一张图,开口说整段台词,AI 让照片“活”过来了!

CGC本周推荐


想让一张静态照片动起来?
想让图片里的角色“开口说话”,且嘴型动作精准匹配语音?

今天,我们带来 NVIDIA 的 Audio2Face-2D
让一张肖像图 跟着声音“动”起来,轻松生成 真实自然的口型动画






Audio2Face-2D是什么


NVIDIA Audio2Face-2D是一款基于生成模型的 AI 微服务,可以通过 一张肖像照片 + 一段音频,生成与语音完美同步的 口型动画。通过音频内容识别口腔发音特征,转化为面部运动轨迹,再由生成模型 驱动照片动起来,让静态人物“开口说话”。




FEATURE
功能亮点


Audio-to-Face

Digital Humans

Nvidia Maxine

Speech-to-animation




应用场景



虚拟数字人

让虚拟角色“对口型发言”,打造更加真实可信的交互体验



AI 视频生成
帮助内容创作者将静态照片变为动态口型视频,节约大量动画制作成本。


无障碍交流

帮助听障人群通过嘴型辅助理解语音内容,增强沟通体验。    



语音生成视频  

NVIDIA Audio2Face-2D 利用强大的生成模型,将音频输入转化为逼真的口型动画,完美同步语音与嘴部运动。该模型不仅能生成自然的嘴部动作,还能加入如眨眼、眼神转动等表情,使面部动画更加生动真实。

🎬 输入:一张照片 + 任意一段语音

🎥 输出:嘴型与语音完美同步的视频





如何使用

「模型名称」

Audio2Face-2d

📌 使用方式:

> 访问登录 Lichan CGC 平台
> 关键词检索资源 Audio2Face-2d
> 点击【资源下载】下载 NIM 资源
> 或点击【尝鲜试用】在线体验 NIM 服务





立即前往:

📎 https://cgc.chancloud.com/


进入 CGC 平台,亲自体验从一句话、一道线条或一张照片开始,构建属于你的视觉宇宙!




LICHAN CGC


丽蟾 CGC(China GPU Cloud)是面向中国开发者的一站式 AI 微服务资源平台,也是目前唯一获得 NVIDIA NGC 官网跳转链接的中国平台。目前已经同步上线 80+ 海外热门 NVIDIA NIM。




联系客服

扫描二维码

获取更多资讯