上海信弘智能科技有限公司,信弘,智能,信弘智能科技,Elite Partner,Omniverse,智能科技,NVIDIA GPU,NVIDIA DGX, vGPU,TESLA,QUADRO,AI,AI培训,AI课程,人工智能,解决方案,DLI,Mellanox,IB, 深度学习,RTX,IT,ORACLE 数据库,ORACLE云服务,深度学习学院,bigdata,大数据,数据安全备份,鼎甲,高性能计算, 虚拟机,虚拟桌面,虚拟软件,硬件,软件,加速计算,HPC,超算,服务器,虚拟服务器,IT咨询,IT系统规划,应用实施,系统集成

ZENTEK 新闻

NVIDIA Maxine 开发者平台将改变价值 100 亿美元的视频会议行业


视频会议让许多人能够随时随地提高工作效率。


现在,NVIDIA 通过让视频会议、呼叫中心和流媒体应用的开发人员轻松地将人工智能集成到他们的工作流程中,提高了这一百亿美元产业中开发人员的工作效率。


新发布的 Maxine AI开发者平台通过增强用户灵活性、参与度和效率等功能,改变了最先进的实时视频会议应用的创建方式。


通过 NVIDIA AI 企业软件平台,Maxine 允许开发人员利用人工智能驱动的最新功能(如增强的视频和音频质量以及增强现实效果),将用户的日常视频通话转变为引人入胜的协作体验。


利用Maxine新功能扩展视频会议


Maxine人工智能开发者平台使开发者能够轻松访问和集成实时的人工智能增强功能,从而提高视频会议用户的参与质量。


降噪、视频去噪和升频以及演播室语音等功能可提高音频和视频流的质量。借助瞪眼校正、实时人像等高级功能以及视频重照和云微服务 Maxine 3D 等未来功能,开发人员可以增强视频会议的参与度和个人联系。


该平台扩展了用于音频、视频和增强现实效果的先进人工智能模型的实用性,开发人员可以通过多种方式提供 Maxine 功能,包括软件开发工具包、微服务,甚至是 NVIDIA 云基础设施提供的应用编程接口(API)端点。


现在提供的 Maxine 生产功能更新包括:


  • 目光接触:改进后的目光接触模型可通过自然的眼球运动实现目光重定向,让与会者更深入地参与会议。

  • 语音字体:这一新模型可将发言者的声音与目标声音相匹配,同时保持语言信息和韵律(节奏和语调)不变。

  • 背景噪音降低 (BNR) 2.0:该模型更新了用于人听和语言编码的降噪功能,特别致力于降低编码单词错误率。


今年春季可提前使用的新功能包括:


  • 语音实时肖像:该模式允许用户通过直接语音或任何音频源驱动自己的肖像,让用户在电话会议中始终保持最佳状态。

  • 录音室语音:该模式可让普通耳机、笔记本电脑和台式机麦克风发出高端录音室麦克风的声音,让用户在电话会议中始终保持最佳音质。


Maxine 早期访问计划共享即将推出的功能的试生产和预发布版本,以获得开发人员对 Maxine 型号的实用性和改进的反馈意见。在这个版本中,我们要求开发人员就开发管道中的早期功能提供反馈,包括:


  • Maxine 3D:该云微服务之前曾在 SIGGRAPH 2023 上进行过研究演示,通过实时 NeRF 技术将 2D 视频转换为 3D 视频,为视频会议提供了新的参与度。

  • 视频重光:这种新模式使用高动态范围图像为用户照明,实现了用户照明与各种背景图像的无缝匹配。

  • API 端点:API 端点为开发人员提供了通过英伟达云基础设施访问 Maxine 功能的灵活性,使 Maxine 集成变得更加简单。


Jugo和阿森纳足球俱乐部实现重大目标


体育赛事是人类的终极体验,它超越国界和语言障碍,将球队和球迷团结在一起。Jugo 使用 Maxine 的人工智能绿幕功能,为虚拟活动提供了一个数字平台,使公司能够使用虚幻引擎创建身临其境的体验,无需使用完整的制作工作室就能将世界各地的球迷聚集在一起。


阿森纳足球俱乐部(Arsenal FC)是英格兰足球超级联赛的豪门球队,它正在与 Jugo 合作,彻底改变足球俱乐部与全球 6 亿球迷互动的方式。双方的合作提供了全新的虚拟体育娱乐体验,提高了全球球迷的参与度。Jugo 将真实的人际互动带入阿森纳的活动中,在支持者和俱乐部的体育英雄之间建立逼真的虚拟联系。


Jugo Experience 的首席执行官 Richard Stirk 说:" Jugo Experience 平台正在改变品牌追求全球知名度和参与度的市场。阿森纳足球俱乐部是全球品牌延伸的完美范例。创造身临其境的品牌体验的灵活性是 Jugo 产品的关键,而 Maxine AI 开发者平台则是这种灵活性的基本组成部分。“


树立人工智能增强型视频会议新标准


Gemelo、Pexip、Spectacle 和 VideoRequest 等首批客户利用早期接入计划中的最新功能,利用商品摄像机和麦克风创建专业视听演播室。


Gemelo 首席执行官 Paul Jaski 表示:" Gemelo 参与测试 Maxine 模型的预发布版本已有数年之久,我们非常重视有机会在 Maxine 功能开发过程中提供早期意见。" 


他还表示:"最新功能 Speech Live Portrait 将为我们的客户在创建定制视频消息方面提供更大的灵活性,开启个性化新时代的大门。"


Pexip 首席技术官 Ian Mortimer 表示:" Pexip 欢迎有机会测试 Maxine 功能的开发版本,并帮助指导最终产品模型的开发。在测试 Maxine BNR 最新版本的过程中,我们看到了可懂度和语音质量的显著改善,并计划继续完善我们的测试参数,以帮助优化人工智能翻译管道的准确性。"


"NVIDIA Maxine Eye Contact API 大大简化了我们为 Spectacle 应用的用户提供引人入胜的视频处理功能的路径,使我们无需担心基础设施和资源密集型集成的问题," Spectacle总裁本杰明-波特曼(Benjamin Portman)说,"有了它,我们能够在短短几天内创建概念验证,加快了生产应用的部署时间表。"


VideoRequest 首席技术官乔-泰勒(Joe Tyler)说:"我们对 Maxine Studio Voice 的早期测试让我们看到了人工智能增强制作和视频推荐的可能性,令人印象深刻。"新的 Maxine BNR 和 Eye Contact 功能将帮助我们的客户克服具有挑战性的录制环境,从而提升视频质量。