Каталог HAQM SageMaker

Безопасно обнаруживайте, управляйте и взаимодействуйте с данными и искусственным интеллектом

Обзор

Новое поколение HAQM SageMaker упрощает обнаружение, управление и совместную работу с данными и ИИ в вашем озере, моделях ИИ и приложениях. С помощью каталога HAQM SageMaker, созданного на основе HAQM DataZone, пользователи могут безопасно находить утвержденные данные и модели, а также получать к ним доступ с помощью семантического поиска с метаданными, созданными генеративным искусственным интеллектом. Кроме того, для поиска данных можно сделать запрос на естественном языке в HAQM Q для разработчиков. Пользователи могут последовательно определять и применять политики доступа, используя единую модель разрешений с детальными средствами управления доступом, централизованно в Единой студии HAQM SageMaker. Легко делитесь данными и активами ИИ, а также совместно работайте над ними с помощью простых рабочих процессов публикации и подписки. Используя SageMaker, вы можете обезопасить и защитить свои модели на базе искусственного интеллекта посредством ограничений HAQM Bedrock и внедрить политики ответственного использования ИИ. Укрепляйте доверие к своей организации с помощью мониторинга и автоматизации качества данных, обнаружения конфиденциальных данных и машинного обучения.

Посмотрите каталог HAQM SageMaker в действии

пиктограмма каталога sagemaker

Преимущества

Откройте для себя масштабные ресурсы данных и искусственного интеллекта с помощью каталога SageMaker, созданного на базе HAQM DataZone. Усовершенствуйте обнаружение данных с помощью генеративного искусственного интеллекта, который автоматически дополняет данные и метаданные бизнес-контекстом, упрощая поиск, понимание и использование информации всеми пользователями. Легко делитесь своими данными, моделями искусственного интеллекта, текстовыми запросами и активами генеративного искусственного интеллекта с помощью фильтрации по названиям таблиц и столбцов или терминам бизнес-глоссария. Автоматически рекомендуйте ценные столбцы и соответствующие аналитические приложения для каждого набора данных, что позволяет применять правильные данные для быстрого построения надлежащих моделей. Поддерживайте как централизованные, так и децентрализованные модели управления, обеспечивая беспрепятственный обмен данными и искусственным интеллектом посредством рабочих процессов публикации и подписки в одном интерфейсе через проекты.

Завоевывайте доверие, отслеживая качество данных и происхождение данных и машинного обучения в SageMaker в режиме реального времени. Автоматизируйте профилирование данных и рекомендации по их качеству, отслеживайте правила качества данных и получайте оповещения. Решайте сложные проблемы с качеством данных, используя подходы, основанные на правилах и машинном обучении, для согласования объектов, чтобы предоставлять высококачественные данные для принятия уверенных бизнес-решений. Обеспечьте прозрачность конвейеров данных и проектов искусственного интеллекта с помощью встроенного мониторинга моделей, позволяющего выявлять предвзятость или сообщать о том, как функции влияют на прогнозирование на основе модели.
Централизуйте безопасность данных и искусственного интеллекта в SageMaker с помощью детальных средств контроля доступа, классификации данных и защитных ограничений, обеспечивающих надлежащее использование данных, аналитики и моделей искусственного интеллекта. Определите разрешения один раз и примените их к данным и моделям. Благодаря встроенной интегрированной среде HAQM Bedrock клиенты могут использовать ограничения HAQM Bedrock в своем приложении на базе генеративного искусственного интеллекта, блокируя вредоносный контент, фильтруя галлюцинации и обеспечивая настраиваемые меры защиты конфиденциальности, безопасности и точности. Автоматически идентифицируйте конфиденциальную информацию в своих конвейерах с помощью HAQM Comprehend.
Соблюдайте аудит и соответствие нормативным требованиям в области использования данных, регистрации и мониторинга моделей. Обеспечьте приемлемое использование аналитических ресурсов и ресурсов искусственного интеллекта на предприятии с помощью изоляции на основе проектов. Изучите использование данных и моделей в вашем озере для повышения безопасности. Применяйте HAQM SageMaker Clarify для мониторинга предвзятости, точности и надежности моделей в соответствии со стандартами ответственного использования ИИ. Сопоставьте затраты с бизнес-инициативами и получите четкое представление об инвестициях в бизнес.

Возможности

Отобранные данные для контекста и удобства поиска

Каталог привносит бизнес-контекст в ваши технические метаданные и позволяет их обогатить. Вы можете сделать данные видимыми в бизнес-контексте, чтобы все пользователи могли быстро и легко находить и понимать их, а также доверять им.

Автоматические рекомендации по метаданным

Автоматизируйте добавление описаний и названий компаний к данным, что поможет вам легко понять контекст и избежать использования скрытых технических названий. Эта автоматизация основана на больших языковых моделях (LLM) и предназначена для повышения точности и согласованности.

Обеспечьте единый уровень безопасности ИИ во всех приложениях.

Ограничения для HAQM Bedrock позволяют оценивать вводимую пользователем информацию и ответы базовой модели (FM) на основе политик для конкретных сценариев использования и обеспечивают дополнительный уровень безопасности независимо от применяемой базовой модели.

Быстрый аудит и отслеживание моделей

Быстро проводите аудит и устраняйте неполадки в работе всех моделей, конечных точек и заданий мониторинга моделей с помощью единого представления. Отслеживайте отклонения от ожидаемого поведения модели, а также отсутствующие или неактивные задания мониторинга с помощью автоматических оповещений.

Качество данных

Благодаря статистике качества данных потребители могут видеть метрики качества данных AWS или сторонних систем. Потребители данных могут принимать решения, используя надежные источники данных, и выполнять поиск ресурсов с учетом контекстной информации о качестве данных. Производители данных и ИТ-команды также могут использовать API, чтобы интегрировать статистику качества данных из сторонних систем в унифицированный портал без входа в консоль.

Происхождение данных и машинного обучения

Изучайте перемещение данных и моделей с течением времени. Происхождение может повысить доверие и грамотность организации в области данных и искусственного интеллекта, помогая клиентам данных понять, откуда поступают сведения, как они изменились и как их потребляют. Вы можете сократить время, затрачиваемое на составление схем и связей для ресурсов данных искусственного интеллекта, устранение неполадок и разработку конвейеров, а также на внедрение новых методов управления данными искусственным интеллектом.

Клиенты

CISCO

«Вы хотите обнаруживать данные, управлять ими и предоставлять общий доступ к ним. Независимо от того, называете ли вы это сеткой данных или полотном данных, данные разных групп существуют в нескольких разрозненных хранилищах, и вам нужен способ объединить их. HAQM SageMaker Catalog объединяет производителей и потребителей данных, позволяя производителям обмениваться данными с помощью встроенных средств управления и контрактов на передачу данных, а потребителям — получать доступ к данным с помощью выбранных ими инструментов»

Шаджа Арул Сельвамани, старший директор по искусственному интеллекту и машинному обучению, Cisco

image

Natera, Inc.

«Наша организация использует HAQM DataZone, ИИ HAQM SageMaker, HAQM Athena и HAQM Redshift для управления клиническими и геномными данными и их анализа. Мы рады, что теперь у нас есть унифицированное управление каталогом HAQM SageMaker, которое упростит поиск данных и доступ к ним, а также позволит нашей команде быстро анализировать релевантные данные во всем домене. Эта интеграция поможет нам создавать персонализированные наборы данных, что может сократить время получения информации и, в конечном итоге, улучшить результаты лечения пациентов по мере достижения нашей цели – сделать персонализированное генетическое тестирование стандартной частью медицинской помощи».

Мирко Бухольцер (Mirko Buholzer), вице-президент по разработке программного обеспечения, Natera, Inc.

image

NatWest

«Наша команда разработчиков платформы данных развертывает несколько инструментов для конечных пользователей для задач проектирования данных, машинного обучения, SQL и генеративного ИИ. Стремясь упростить процессы в банке, мы стараемся сделать проще аутентификацию пользователей и авторизацию доступа к данным. HAQM SageMaker предоставляет готовый пользовательский интерфейс, который помогает нам развертывать единую среду в организации, сокращая время доступа пользователей данных к новым инструментам примерно на 50%».

Захери Андерсон (Zachery Anderson), директор по данным и аналитике, NatWest Group

image