上海信弘智能科技有限公司,信弘,智能,信弘智能科技,Elite Partner,Omniverse,智能科技,NVIDIA GPU,NVIDIA DGX, vGPU,TESLA,QUADRO,AI,AI培训,AI课程,人工智能,解决方案,DLI,Mellanox,IB, 深度学习,RTX,IT,ORACLE 数据库,ORACLE云服务,深度学习学院,bigdata,大数据,数据安全备份,鼎甲,高性能计算, 虚拟机,虚拟桌面,虚拟软件,硬件,软件,加速计算,HPC,超算,服务器,虚拟服务器,IT咨询,IT系统规划,应用实施,系统集成

ZENTEK 新闻

NVIDIA AIOps 合作伙伴生态系统将人工智能与业务相融合


在当今复杂的业务环境中,IT 团队面临着源源不断的挑战,从员工账户锁定等简单问题到重大安全威胁,不一而足。这些情况既需要快速修复,也需要战略防御,使得维持平稳安全运营的工作变得更加艰难。


这就是 AIOps 的用武之地,它将人工智能与 IT 运营相结合,不仅能自动执行日常任务,还能增强安全措施。这种高效的方法可以让团队快速处理小问题,更重要的是,可以比以前更快、更准确地识别和应对安全威胁。


通过使用机器学习,AIOps 不仅成为简化操作的重要工具,还全面加强了安全性。事实证明,对于希望将高级人工智能整合到团队中的企业来说,这将改变游戏规则,帮助他们在潜在的安全风险面前领先一步。


根据 IDC 的数据,IT 运营管理软件市场预计将以每年 10.3% 的速度增长,到 2027 年预计收入将达到 284 亿美元。这一增长凸显了人们越来越依赖 AIOps 来提高运营效率,并将其作为现代网络安全战略的重要组成部分。


随着机器学习运营的快速发展,生成式人工智能时代将继续发生转变,NVIDIA 合作伙伴的广泛生态系统正在提供 AIOps 解决方案,利用 NVIDIA 人工智能来改善IT运营。


英伟达正在通过加速计算和人工智能软件为广泛的 AIOps 合作伙伴生态系统提供帮助。其中包括 NVIDIA AI Enterprise,这是一个可在任何地方运行的云原生堆栈,通过用于加速 AI 模式推理的 NVIDIA NIM、用于基于 AI 的网络安全的 NVIDIA Morpheus 和用于自定义生成式 AI 的 NVIDIA NeMo 等软件为 AIOps 奠定基础。该软件有助于实现基于 GenAI 的聊天机器人、摘要和搜索功能。


使用NVIDIA AI 的 AIOps 提供商包括:


  • Dynatrace Davis Hypermodal AI 通过集成因果、预测和生成 AI 技术,并增加 Davis CoPilot,推进了 AIOps 的发展。这种组合通过提供精确和可操作的人工智能驱动的答案和自动化,增强了整个 IT 、开发、安全和业务运营的可观察性和安全性。

  • Elastic提供用于语义和矢量搜索的 Elasticsearch Relevance Engine(ESRE),它与 GPT-4 等流行的 LLM 集成,为其可观察性和安全性解决方案中的人工智能助手提供动力。Observability AI Assistant 是下一代 AI Ops 功能,可帮助 IT 团队了解复杂系统、监控健康状况并自动修复运行问题。

  • New Relic 利用其机器学习、生成式人工智能助理框架和在可观察性方面的长期专业知识,推进 AIOps 的发展。其机器学习和高级逻辑可帮助 IT 团队减少警报噪音、提高平均检测时间和平均修复时间、自动进行根本原因分析并生成回顾。其 GenAI 助手 New Relic AI 可让用户在不切换上下文的情况下识别、解释和解决错误,并直接在开发人员的集成开发环境中建议和应用代码修复,从而加速问题的解决。它还通过自动生成高级系统运行状况报告、分析和汇总仪表盘以及回答有关用户应用程序、基础架构和服务的纯语言问题,将事件可见性和预防措施扩展到非技术团队。借助 NVIDIA GPU,New Relic 还能为人工智能驱动的应用提供全栈可观察性。

  • PagerDuty 在PagerDuty Copilot 中推出了一项新功能,在 Slack 中集成了一个生成式人工智能助手,提供从事件开始到解决的洞察力,简化了事件生命周期,减少了 IT 团队的手动任务负荷。

  • ServiceNow 致力于创建积极主动的 IT 运营,包括自动洞察快速事件响应、优化服务管理和检测异常情况。现在,ServiceNow 与 NVIDIA 合作,正在推进人工智能生成技术,以进一步创新技术服务和运营。

  • Splunk 的技术平台应用人工智能和机器学习来自动识别、诊断和解决运营问题和威胁,从而提高 IT 效率和安全态势。Splunk IT Service Intelligence 是 Splunk 的主要 AIOps 产品,提供嵌入式人工智能驱动的事件预测、检测和解决功能。


包括亚马逊网络服务(AWS)、谷歌云(Google Cloud)和微软 Azure 在内的云服务提供商使企业能够利用云资源的规模和灵活性实现 IT 运营的自动化和优化。


  • AWS 提供一整套有利于 AIOps 的服务,包括用于监控和可观察性的 Amazon CloudWatch;用于跟踪用户活动和 API 使用情况的 AWS CloudTrail;用于创建可重复和负责任的机器学习工作流的 Amazon SageMaker;以及用于无服务器计算的 AWS Lambda,允许根据触发自动执行响应操作。

  • Google Cloud 通过谷歌云运营(Google Cloud Operations)等服务为 AIOps 提供支持,该服务可为云上和内部部署的应用程序提供监控、日志记录和诊断功能。谷歌云的人工智能和机器学习产品包括用于模型训练和预测的 Vertex AI ,以及利用谷歌基础设施的处理能力进行快速 SQL 查询的 BigQuery。

  • Microsoft Azure 通过Azure Monitor 对应用程序、服务和基础架构进行全面监控,促进了 AIOps 的发展。Azure Monitor 的内置 AIOps 功能有助于预测容量使用情况、实现自动扩展、识别应用程序性能问题以及检测虚拟机、容器和其他资源中的异常行为。Microsoft Azure Machine Learning (AzureML) 提供了一个基于云的 MLOps 环境,可负责任、安全、大规模地训练、部署和管理机器学习模型。 


专门从事 MLOps 的平台主要侧重于简化机器学习模型的生命周期,从开发到部署和监控。虽然其核心任务是使机器学习更易于访问、更高效、更可扩展,但其技术和方法通过增强 IT 运营中的人工智能能力,间接支持了 AIOps:


  • Anyscale 的平台基于 Ray,可以轻松扩展人工智能和机器学习应用,包括在 AIOps 中用于异常检测和自动修复等任务的应用。通过促进分布式计算,Anyscale 可帮助 AIOps 系统更高效地处理大量运营数据,实现实时分析和决策。

  • Dataiku 可用于创建预测IT系统故障或优化资源分配的模型,其功能允许IT团队在生产环境中快速部署和迭代这些模型。

  • Dataloop 的平台提供完整的数据生命周期管理,并以灵活的方式为端到端工作流程插入人工智能模型,使用户能够利用其数据开发人工智能应用。

  • DataRobot 是一个完整的人工智能生命周期平台,可帮助 IT 运营团队快速构建、部署和管理人工智能解决方案,从而提高运营效率和性能。

  • Domino Data Lab 的平台可让企业及其数据科学家在统一的端到端平台上构建、部署和管理人工智能。所有环境中的数据、工具、计算、模型和项目都是集中管理的,因此团队可以进行协作,监控生产模型,并对管理人工智能创新的最佳实践进行标准化。这种方法对 AIOps 至关重要,因为它在数据科学团队所需的自助服务与完整的可重复性、细粒度成本跟踪和主动治理之间取得了平衡,满足了 IT 运营需求。

  • Weights & Biases 提供了用于实验跟踪、模型优化和协作的工具,这对于开发和微调 AIOps 中使用的人工智能模型至关重要。Weights & Biases 可提供有关模型性能的详细见解,并促进团队间的协作,有助于确保为 IT 运营部署的人工智能模型既有效又透明。