上海信弘智能科技有限公司,信弘,智能,信弘智能科技,Elite Partner,Omniverse,智能科技,NVIDIA GPU,NVIDIA DGX, vGPU,TESLA,QUADRO,AI,AI培训,AI课程,人工智能,解决方案,DLI,Mellanox,IB, 深度学习,RTX,IT,ORACLE 数据库,ORACLE云服务,深度学习学院,bigdata,大数据,数据安全备份,鼎甲,高性能计算, 虚拟机,虚拟桌面,虚拟软件,硬件,软件,加速计算,HPC,超算,服务器,虚拟服务器,IT咨询,IT系统规划,应用实施,系统集成

GTC24 | 专家中文解读：大语言模型（LLM）新技术

专家中文解读：大语言模型（LLM）新技术包括三场 Watch Party 会议。GTC Watch Party 是由 NVIDIA 本地专家主持，以中文讲解，带领参与者同步观看某一精选演讲并解读和实时答疑的会议形式。这是一个互动式的会议，我们鼓励您在聊天区参与讨论，提出见解或问题。

三场 Watch Party 分别聚焦于利用 NVIDIA 技术探索检索增强生成（RAG）的潜力、定制多语言 LLM，以及将生成式 AI 和 LLM 应用于企业流程自动化的重要性和实践方法。这三场会议将全面展示如何利用 NVIDIA 的技术和框架，优化各种语言模型以满足不同需求，并将其成功地应用于商业环境中。

Watch Party：RAG 检索增强生成：

设计系统、数据和定制概述

会议代码：[WP62744a]

会议时间：

3 月 24 日（星期日）上午 10:30 – 12:00

演讲嘉宾：

Miguel Martinez | NVIDIA 高级深度学习数据科学家

Meriem Bendris | NVIDIA 高级深度学习数据科学家

Sergio Perez Perez | NVIDIA 解决方案架构师

Dora Csillag | NVIDIA 高级解决方案架构师——生成式 AI & 推理

会议主持人：

李奕澎 | NVIDIA 企业开发者社区经理

会议内容：

利用 NVIDIA 技术发掘检索增强生成（RAG）的潜力。RAG 系统将信息检索与生成模型相结合，从大型语料库中检索相关文档段落，然后将其用于生成详细答案的上下文。在本次演讲中，我们将介绍端到端 RAG 系统，包括数据准备、检索器和生成器模型的设计。此外，我们还将展示一个使用 NVIDIA TensorRT-LLM 和 NeMo 的 RAG 系统示例，并介绍针对特定任务的 RAG 模型评估和定制。

扫描上方二维码查看会议详情并注册

Watch Party：使用 NVIDIA NeMo

定制多语言的大语言模型

会议代码：[WP62743]

会议时间：

3 月 24 日（星期日）上午 9:00 – 10:30

演讲嘉宾：

Miguel Martinez | NVIDIA 高级深度学习数据科学家

Meriem Bendris | NVIDIA 高级深度学习数据科学家

Dora Csillag | NVIDIA 高级解决方案架构师——生成式 AI & 推理

Sergio Perez Perez | NVIDIA 解决方案架构师

会议主持人：

李奕澎 | NVIDIA 企业开发者社区经理

会议内容：

我们将专注于为英语以外的语言定制基础 LLM。本次会议将介绍提示工程（prompt-engineering）、提示微调（prompt-tuning）、全参数高效微调（parameter-efficient fine-tuning）和监督指令微调（supervised instruction fine-tuning，SFT）等技术，使 LLM 能够适应不同的使用情况。我们将利用 NVIDIA NeMo 框架展示其中一些技术，这些技术既适用于 NVIDIA 基础模型，也适用于 Llama-2 等其他社区模型。最后，我们将演示如何使用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器来高效部署定制模型。

扫描上方二维码查看会议详情并注册

Watch Party：大语言模型的理想方案：

平衡准确性、延迟和成本提升性能

会议代码：[WP62163]

会议时间：

3 月 24 日（星期日）下午 2:00 – 3:30

演讲嘉宾：

Janaki Vamaraju | NVIDIA 深度学习架构师兼科学家

Elena Agostini | NVIDIA 高级软件工程师

Nik Spirin | NVIDIA 生成式 AI 和 LLMOps 平台总监

会议主持人：

李奕澎 | NVIDIA 企业开发者社区经理

会议内容：

生成式 AI 和 LLM 是实现企业流程自动化的强大工具。虽然许多企业已经开始了评估和实验过程，但在调整 LLM 应用程序以获得最佳性能，并将其部署到生产中等方面仍存在差距。我们将降低解决方案设计的复杂性，指导您从使用预训练的基础模型进行初始设置，到通过信息检索和定制得到最先进的结果。在深入探讨定制技术之前，我们强调定义成功标准（准确性、延迟和成本）的重要性。此外，我们还将介绍一系列策略，包括加速推理、即时工程、检索增强生成（RAG）、领域适应和微调。您将从真实的客户参与中获得深入洞察，并将其转化为可操作的建议。本会议是任何想要在业务中拥有 LLM 力量者的必备指南。