HAQM SageMaker Catalog

Descubra, governe e colabore em dados e IA de forma segura

Visão geral

A próxima geração do HAQM SageMaker simplifica a descoberta, a governança e a colaboração de dados e de IA em todo o lakehouse, os modelos de IA e as aplicações. Com o HAQM SageMaker Catalog, desenvolvido no HAQM DataZone, os usuários podem descobrir e acessar dados e modelos aprovados de forma segura ao usar a pesquisa semântica com metadados criados por IA generativa, ou simplesmente solicitar ao HAQM Q Developer, em linguagem natural, que encontre seus dados. Os usuários podem definir e aplicar políticas de acesso de maneira consistente por meio de um único modelo de permissões com controles de acesso refinados, e de forma centralizada, no Estúdio Unificado HAQM SageMaker. Compartilhe e trabalhe de forma colaborativa sem complicações em ativos de dados e de IA por meio de fluxos de trabalho simples de publicação e de assinatura. Com o SageMaker, é possível proteger e salvaguardar seus modelos de IA ao usar as barreiras de proteção do HAQM Bedrock e implementar políticas de IA responsável. Desenvolva a confiança em toda a sua organização com o monitoramento de qualidade de dados, a automação, a detecção de dados confidenciais e a linhagem de dados e de machine learning (ML).

Veja o HAQM SageMaker Catalog em ação

miniatura do sagemaker catalog

Benefícios

Descubra seus ativos de dados e de IA em grande escala com o SageMaker Catalog, uma solução desenvolvida no HAQM DataZone. Aprimore a descoberta de dados com a IA generativa para enriquecer os dados e os metadados de forma automática com o contexto de negócios, facilitando a busca, a compreensão e o uso dos dados por todos os usuários. Compartilhe os dados, os modelos de IA, os prompts e os ativos de IA generativa, com a possibilidade de filtragem por nomes de tabelas e colunas ou por termos do glossário de negócios. Realize a recomendação automática de colunas importantes e de aplicações analíticas relevantes para cada conjunto de dados, possibilitando o uso adequado dos dados para o desenvolvimento dos modelos certos com rapidez. Forneça suporte tanto para modelos de governança centralizados quanto para modelos descentralizados com o compartilhamento contínuo de dados e de IA por meio de fluxos de publicação e de assinatura em uma única experiência usando os Projetos.

Conquiste a confiança por meio da visibilidade em tempo real da qualidade dos dados e da linhagem de dados e de ML no SageMaker. Automatize o processo de criação de perfil de dados e o fornecimento de recomendações de qualidade, monitore as regras de qualidade dos dados e receba alertas. Resolva desafios complexos de detecção relacionados à qualidade dos dados ao usar abordagens baseadas em regras e em ML para reconciliar entidades, garantindo a entrega de dados de alta qualidade para a tomada de decisões empresariais assertivas. Promova a transparência em pipelines de dados e em projetos de IA com o monitoramento de modelos integrado para detectar viés ou relatar como os recursos contribuem para a predição de modelo.
Centralize a segurança dos dados e da IA no SageMaker com controles de acesso granulares, classificação de dados e barreiras de proteção para garantir que dados, analytics e modelos de IA sejam usados de forma apropriada. Defina as permissões uma única vez e aplique-as a todos os dados e modelos. Com o HAQM Bedrock integrado nativamente, os clientes podem usar as Barreiras de Proteção para HAQM Bedrock em suas aplicações de IA generativa ao bloquear conteúdo prejudicial, filtrar alucinações e habilitar proteções personalizáveis para fins de privacidade, segurança e precisão. Identifique informações confidenciais de maneira automática em seus pipelines usando o HAQM Comprehend.
Garanta a conformidade com auditorias e regulamentações por meio do registro em log e do monitoramento do uso de dados e de modelos. Forneça suporte ao uso aceitável dos ativos de analytics e de IA em toda a empresa com o isolamento baseado em projetos. Compreenda o uso de dados e de modelos em seu lakehouse para a obtenção de uma segurança aprimorada. Use o HAQM SageMaker Clarify para monitorar os modelos em relação a viés, precisão e robustez, em conformidade com os padrões de IA responsável. Alinhe os custos às iniciativas empresariais e forneça uma visão transparente dos investimentos empresariais.

Recursos

Dados selecionados para contexto e facilidade de localização

O SageMaker Catalog fornece contexto empresarial aos metadados técnicos e permite aprimorá-los com as informações de negócios. Você pode tornar os dados visíveis no contexto comercial para que todos os seus usuários encontrem, entendam e confiem nos dados com rapidez e facilidade.

Recomendações automatizadas de metadados

Automatize a adição de descrições e nomes empresariais aos dados, o que ajuda a entender facilmente o contexto e a evitar lidar com nomes técnicos enigmáticos. Essa automação é alimentada por grandes modelos de linguagem (LLMs) para aumentar a precisão e a consistência.

Ofereça um nível consistente de segurança de IA em todas as suas aplicações

As barreiras de proteção do HAQM Bedrock ajudam a avaliar as entradas fornecidas pelos usuários e as respostas dos modelos de base (FMs) com base em políticas específicas para cada caso de uso. Além disso, elas fornecem uma camada adicional de proteção, independentemente dos FMs subjacentes.

Faça a auditoria e o acompanhamento de modelos com rapidez

Audite e solucione rapidamente a performance de todos os modelos, endpoints e tarefas de monitoramento de modelos por meio de uma exibição unificada. Rastreie desvios do comportamento esperado do modelo e trabalhos de monitoramento ausentes ou inativos, com alertas automatizados.

Qualidade dos dados

Por meio das estatísticas de qualidade de dados, os consumidores de dados podem visualizar métricas de qualidade provenientes da AWS ou de sistemas de entidades externas. Os consumidores de dados podem confiar nas fontes de dados que utilizam para tomar decisões e ter um contexto de qualidade de dados enquanto pesquisam ativos. Além disso, os produtores de dados e as equipes de TI podem usar APIs para incorporar as estatísticas de qualidade de dados de sistemas de entidades externas em um portal unificado e externo ao console.

Linhagem de dados e de ML

Compreenda a movimentação de dados e de modelos ao longo do tempo. A linhagem pode aumentar a confiança e a alfabetização em dados e em IA de uma organização ao ajudar os consumidores de dados a compreenderem a origem dos dados, as alterações realizadas e os padrões de consumo. É possível diminuir o tempo dedicado ao mapeamento de ativos de dados e de IA e suas relações, à solução de problemas e ao desenvolvimento de pipelines, e à implementação de práticas de governança de dados e de IA.

Clientes

CISCO

“Você quer descobrir, compartilhar e controlar seus dados. Quer você chame isso de data mesh ou de data fabric, os dados existem em diferentes equipes e em vários silos, e você precisa de uma maneira de reuni-los. O catálogo do HAQM SageMaker conecta produtores e consumidores de dados, permitindo que os produtores compartilhem dados com controles e contratos de dados integrados e, ao mesmo tempo, permitindo que os consumidores acessem os dados usando as ferramentas de sua preferência”

Shaja Arul Selvamani, diretor sênior de IA/ML da Cisco

image

Natera, Inc.

“A nossa organização está usando o HAQM DataZone, o HAQM SageMaker IA, o HAQM Athena e o HAQM Redshift para gerenciar e analisar os dados clínicos e genômicos. Estamos entusiasmados por agora termos a governança unificada do HAQM SageMaker Catalog, que simplificará a descoberta e o acesso aos dados, possibilitando que nossa equipe analise rapidamente os dados relevantes em todo o nosso domínio. Essa integração nos ajudará a criar conjuntos de dados personalizados, que têm o potencial de reduzir o tempo para obtenção de insights e, em última análise, promover melhores resultados para os pacientes à medida que avançamos em nossa meta de tornar o teste genético personalizado uma parte padrão do atendimento médico.”

Mirko Buholzer, vice-presidente da área de engenharia de software, Natera, Inc.

image

NatWest

“Nossa equipe de engenharia de plataforma de dados está implantando diversas ferramentas para usuários finais, voltadas para tarefas de engenharia de dados, machine learning (ML), SQL e IA generativa. À medida que buscamos simplificar os processos em todo o banco, investigamos maneiras de agilizar a autenticação de usuários e a autorização de acesso aos dados. O HAQM SageMaker fornece uma experiência de usuário pronta para uso, que nos ajuda a implantar um único ambiente em toda a organização, reduzindo em cerca de 50% o tempo necessário para que nossos usuários de dados acessem novas ferramentas.”

Zachery Anderson, diretor executivo de dados e análises, NatWest Group

image