HAQM SageMaker 目录

安全地发现、治理和协作处理数据和人工智能

概览

下一代 HAQM SageMaker 可简化湖仓、人工智能模型和应用程序中数据和人工智能的发现、治理和协作。借助基于 HAQM DataZone 构建的 HAQM SageMaker Catalog,用户可以使用生成式人工智能创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 HAQM Q 开发者版来查找数据。用户可以在 HAQM SageMaker 融通式合作开发工作室中集中使用具有精细访问控制的单一权限模型,以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程,无缝共享和协作处理数据和人工智能资产。借助 SageMaker,您可以使用 HAQM Bedrock 护栏保护您的 AI 模型,并实施负责任的人工智能策略。通过数据质量监控和自动化、敏感数据检测以及数据和机器学习(ML)任务流水线,让整个组织安心无忧。

查看 HAQM SageMaker 目录的实际运行情况

sagemaker 目录缩略图

优势

使用基于 HAQM DataZone 构建的 SageMaker Catalog,大规模发现您的数据和人工智能资产。使用生成式人工智能增强数据发现,以便通过业务上下文自动丰富您的数据和元数据,让所有用户都能更轻松地查找、理解和使用数据。通过按表和列名称或业务术语表术语进行筛选,共享数据、人工智能模型、提示和生成式人工智能资产。自动为每个数据集推荐有价值的列和相关的分析应用程序,确保能够使用正确的数据快速构建正确的模型。通过项目在单项体验中发布和订阅工作流程,使用无缝数据和人工智能共享,支持集中式和分散式治理模型。

通过实时查看 SageMaker 中的数据质量和数据,以及机器学习任务流水线,安心无忧。自动进行数据分析和数据质量建议,监控数据质量规则,并接收警报。使用基于规则和机器学习的方法协调实体,解决难以发现的数据质量挑战,以便您可以交付高质量的数据,从而做出自信的业务决策。使用内置的模型监控,以检测偏差或报告功能如何影响模型预测,从而提高数据管道和人工智能项目的透明度。
使用精细访问控制、数据分类和护栏,将数据和人工智能安全集中在 SageMaker 中,以确保正确使用数据、分析和人工智能模型。只需定义一次权限,即可在数据和模型中强制执行权限。通过原生集成的 HAQM Bedrock,客户可以在生成式人工智能应用程序中利用 HAQM Bedrock 防护机制,屏蔽有害内容、过滤幻觉以及启用可自定义的隐私、安全和准确性保护措施。使用 HAQM Comprehend 自动识别管道中的敏感信息。
通过数据使用与模型日志记录和监控,满足审计和监管合规要求。通过基于项目的隔离,支持在整个企业中合理使用分析和人工智能资产。了解整个湖仓的数据和模型使用情况,以增强安全性。使用 HAQM SageMaker Clarify 监控模型的偏差、准确性和稳健性,使之符合负责任的人工智能标准。将成本与业务计划保持一致,并提供清晰的业务投资视图。

功能

针对环境和可查找性的精选数据

SageMaker Catalog 为您的技术元数据提供业务背景,让您能够利用业务背景对元数据进行丰富。您可以开放具有业务环境的数据的可见性,让所有用户都能快速而轻松地查找、理解和信任数据。

自动推荐元数据

自动将业务描述和名称添加到数据中,这有助于您轻松理解环境,并免于应对晦涩的技术名称。该自动化功能由大型语言模型(LLM)驱动,可提高准确性和一致性。

为您的所有应用程序提供一致的 AI 安全级别

HAQM Bedrock 护栏可根据特定使用案例的策略,帮助评估用户输入和基础模型(FM)响应,无论底层基础模型如何,均提供额外的保障措施。

快速审计和跟踪模型

通过统一视图,快速审核所有模型、端点和模型监控工作的性能并排除故障。通过自动警报跟踪预期模型行为的偏差,以及缺失或无效的监控作业。

数据质量

借助数据质量统计数据,数据使用者可以查看来自 AWS 或第三方系统的数据质量指标。数据使用者可以信任他们用于决策的数据来源,并在搜索资产时了解数据质量背景。数据生产者和 IT 团队还可以使用 API,将来自第三方系统的数据质量统计数据整合到控制台之外的统一门户中。

数据和机器学习任务流水线

了解数据和模型的历时变化。任务流水线可以帮助数据使用者了解数据的来源、变化方式及其使用情况,从而提高信任度和组织的数据和人工智能素养。您可以减少映射数据和人工智能资产及其关系、排除故障和开发管线以及维护数据和人工智能治理实践所花费的时间。

客户

CISCO

“您想要发现、共享和管理您的数据。无论您将其称为数据网格还是数据编织架构,数据都分散在不同团队的多个部门中,而您需要想个办法将其整合起来。HAQM SageMaker Catalog 连接数据生产者和使用者,使生产者能够通过内置控件和数据合同共享数据,同时允许使用者使用其选择的工具访问数据”

Shaja Arul Selvamani,Cisco AI/ML 高级总监

image

Natera, Inc.

“我们的组织一直在利用 HAQM DataZone、HAQM SageMaker 人工智能、HAQM Athena 和 HAQM Redshift 来管理和分析我们的临床和基因组数据。我们很高兴现在能使用 HAQM SageMaker Catalog 的统一治理,这将简化我们的数据发现和访问,让我们的团队能够快速分析整个域中的相关数据。这种整合将帮助我们创建量身定制的数据集,从而有可能缩短我们获得见解的时间,并最终改善患者预后效果,实现我们让个性化基因检测成为标准医疗服务的目标。”

Mirko Buholzer,Natera, Inc 软件工程副总裁

image

NatWest

“我们的数据平台工程团队一直在为数据工程、ML、SQL 和生成式人工智能任务部署多种终端用户工具。我们希望简化整个银行的流程,因此一直在考虑简化用户身份验证和数据访问授权。HAQM SageMaker 可提供现成的用户体验,帮助我们在整个组织内部署单一环境,将数据用户访问新工具所需的时间减少约 50%。”

Zachery Anderson,NatWest Group 首席数据和分析官

image