专家中文解读:大语言模型(LLM)新技术包括三场 Watch Party 会议。GTC Watch Party 是由 NVIDIA 本地专家主持,以中文讲解,带领参与者同步观看某一精选演讲并解读和实时答疑的会议形式。这是一个互动式的会议,我们鼓励您在聊天区参与讨论,提出见解或问题。
三场 Watch Party 分别聚焦于利用 NVIDIA 技术探索检索增强生成(RAG)的潜力、定制多语言 LLM,以及将生成式 AI 和 LLM 应用于企业流程自动化的重要性和实践方法。这三场会议将全面展示如何利用 NVIDIA 的技术和框架,优化各种语言模型以满足不同需求,并将其成功地应用于商业环境中。
Watch Party:RAG 检索增强生成:
设计系统、数据和定制概述
会议代码:[WP62744a]
会议时间:
3 月 24 日(星期日) 上午 10:30 – 12:00
演讲嘉宾:
Miguel Martinez | NVIDIA 高级深度学习数据科学家
Meriem Bendris | NVIDIA 高级深度学习数据科学家
Sergio Perez Perez | NVIDIA 解决方案架构师
Dora Csillag | NVIDIA 高级解决方案架构师——生成式 AI & 推理
会议主持人:
李奕澎 | NVIDIA 企业开发者社区经理
会议内容:
利用 NVIDIA 技术发掘检索增强生成(RAG)的潜力。RAG 系统将信息检索与生成模型相结合,从大型语料库中检索相关文档段落,然后将其用于生成详细答案的上下文。在本次演讲中,我们将介绍端到端 RAG 系统,包括数据准备、检索器和生成器模型的设计。此外,我们还将展示一个使用 NVIDIA TensorRT-LLM 和 NeMo 的 RAG 系统示例,并介绍针对特定任务的 RAG 模型评估和定制。
扫描上方二维码查看会议详情并注册
Watch Party:使用 NVIDIA NeMo
定制多语言的大语言模型
会议代码:[WP62743]
会议时间:
3 月 24 日(星期日) 上午 9:00 – 10:30
演讲嘉宾:
Miguel Martinez | NVIDIA 高级深度学习数据科学家
Meriem Bendris | NVIDIA 高级深度学习数据科学家
Dora Csillag | NVIDIA 高级解决方案架构师——生成式 AI & 推理
Sergio Perez Perez | NVIDIA 解决方案架构师
会议主持人:
李奕澎 | NVIDIA 企业开发者社区经理
会议内容:
我们将专注于为英语以外的语言定制基础 LLM。本次会议将介绍提示工程(prompt-engineering)、提示微调(prompt-tuning)、全参数高效微调(parameter-efficient fine-tuning)和监督指令微调(supervised instruction fine-tuning,SFT)等技术,使 LLM 能够适应不同的使用情况。我们将利用 NVIDIA NeMo 框架展示其中一些技术,这些技术既适用于 NVIDIA 基础模型,也适用于 Llama-2 等其他社区模型。最后,我们将演示如何使用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器来高效部署定制模型。
扫描上方二维码查看会议详情并注册
Watch Party:大语言模型的理想方案:
平衡准确性、延迟和成本提升性能
会议代码:[WP62163]
会议时间:
3 月 24 日(星期日) 下午 2:00 – 3:30
演讲嘉宾:
Janaki Vamaraju | NVIDIA 深度学习架构师兼科学家
Elena Agostini | NVIDIA 高级软件工程师
Nik Spirin | NVIDIA 生成式 AI 和 LLMOps 平台总监
会议主持人:
李奕澎 | NVIDIA 企业开发者社区经理
会议内容:
生成式 AI 和 LLM 是实现企业流程自动化的强大工具。虽然许多企业已经开始了评估和实验过程,但在调整 LLM 应用程序以获得最佳性能,并将其部署到生产中等方面仍存在差距。我们将降低解决方案设计的复杂性,指导您从使用预训练的基础模型进行初始设置,到通过信息检索和定制得到最先进的结果。在深入探讨定制技术之前,我们强调定义成功标准(准确性、延迟和成本)的重要性。此外,我们还将介绍一系列策略,包括加速推理、即时工程、检索增强生成(RAG)、领域适应和微调。您将从真实的客户参与中获得深入洞察,并将其转化为可操作的建议。本会议是任何想要在业务中拥有 LLM 力量者的必备指南。
扫描上方二维码查看会议详情并注册
GTC 2024 注册教程请点击链接:
大语言模型(LLM)新技术相关专家中文解读,请扫描下方二维码,查看专题会议目录。
如何登录和收藏
专家中文解读:
大语言模型(LLM)新技术
扫描上方二维码打开链接,
点击“Add to Schedule”绿色按钮登录
步骤二:
通过左侧对话框登录,
如注册“线上免费参会”账号请用此链接:
https://register.nvidia.cn/flow/nvidia/gtcs24/digitalregistrationchina/createaccount
步骤三:
登录后,跳转到所选演讲的页面,
点击“Add to Schedule”绿色按钮预约该演讲
状态变为“Scheduled”即预约成功