Вопросы и ответы по HAQM DocumentDB (с поддержкой совместимости с MongoDB)

Общие вопросы

Открыть все

Сервис HAQM DocumentDB (совместимость с MongoDB) – это быстрая, масштабируемая, высокодоступная и полностью управляемая корпоративная база данных документов, которая поддерживает специализированные рабочие нагрузки JSON. HAQM DocumentDB специально создавалась как база данных документов, поэтому в ней очень легко сохранять, индексировать данные в формате JSON и выполнять запросы к ним. Для запуска и масштабирования рабочих нагрузок в HAQM DocumentDB, а также для управления ими разработчики могут использовать тот же код приложения, драйверы и инструменты MongoDB, с которыми работают сейчас. Получите усовершенствованную производительность, масштабируемость и доступность, не беспокоясь об управлении базовой инфраструктурой.

С помощью Сервиса миграции баз данных AWS (AWS DMS) клиенты могут с минимальными простоями перенести свои нереляционные базы данных MongoDB, размещенные как локально, так и в Эластичном облаке вычислений HAQM (EC2), в сервис HAQM DocumentDB. HAQM DocumentDB не требует предварительных вложений, оплате подлежат только используемые ресурсы.

Документно-ориентированные базы данных – это одна из самых быстро развивающихся категорий баз данных noSQL. Это связано в первую очередь с тем, что базы данных документов поддерживают и гибкие схемы, и широкие возможности для запросов. Модель документов – отличный выбор для случаев использования с динамическими наборами данных, которые требуют специальных запросов, индексирования и агрегирования. Благодаря масштабу, который обеспечивает HAQM DocumentDB, она применяется самыми разными клиентами для таких сценариев использования, как управление контентом, персонализация, каталоги, мобильные и веб-приложения, IoT и управление профилями.

«Совместимость с MongoDB» означает, что HAQM DocumentDB взаимодействует с открытыми API MongoDB версий 3.6, 4.0 и 5.0 на платформе Apache 2.0. Таким образом, вы можете использовать драйверы, приложения и инструменты MongoDB в HAQM DocumentDB практически без изменений. HAQM DocumentDB поддерживает большинство API MongoDB, обычно используемых клиентами, но не все. Мы стремимся предоставить клиентам возможности, которые им действительно необходимы.

С момента выпуска мы прислушиваемся к отзывам клиентов и уже добавили более 80 возможностей, в том числе совместимость с MongoDB 4.0 и 5.0, транзакции и сегменты. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях HAQM DocumentDB см. в разделе «Объявления об HAQM DocumentDB» на странице ресурсов по HAQM DocumentDB.

Нет. HAQM DocumentDB не использует код SSPL для MongoDB, поэтому соответствующая лицензия не распространяется на этот сервис. Вместо этого HAQM DocumentDB взаимодействует с открытыми API MongoDB 3.6, 4.0 и 5.0 на платформе Apache 2.0. Мы продолжим прислушиваться к отзывам клиентов и добавлять необходимые им возможности. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях HAQM DocumentDB см. в разделе «Объявления об HAQM DocumentDB» на странице ресурсов по HAQM DocumentDB.

С помощью Сервиса миграции баз данных AWS (DMS) клиенты могут с минимальными простоями перенести в сервис HAQM DocumentDB свои базы данных MongoDB, размещенные как локально, так и в Эластичном вычислительном облаке HAQM (EC2). DMS позволяет выполнить миграцию фрагментированного кластера или набора реплик MongoDB в HAQM DocumentDB. Кроме того, для переноса данных из базы данных MongoDB в HAQM DocumentDB клиенты могут использовать большинство существующих инструментов, в том числе mongodump/mongorestore, mongoexport/mongoimport, и инструменты сторонних разработчиков, поддерживающие режим Change Data Capture (CDC) через oplog. Подробнее см. в разделе о миграции в HAQM DocumentDB.

Нет, сервис HAQM DocumentDB поддерживает подавляющее большинство драйверов MongoDB, совместимых с MongoDB 3.4 и более поздних версий.

Да. Благодаря совместимости с MongoDB 4.0, HAQM DocumentDB теперь поддерживает возможность выполнять транзакции атомарности, непротиворечивости, изолированности, долговечности (ACID) для нескольких документов, выражений, коллекций и баз данных одновременно.

Нет, HAQM DocumentDB не следует тем же жизненным циклам поддержки, что и MongoDB, и график EOL MongoDB не применяется к HAQM DocumentDB.

Развертывание кластеров HAQM DocumentDB выполняется в HAQM VPC (VPC), принадлежащем клиенту. Доступ к ним можно получить с инстансов Эластичного облака вычислений HAQM (EC2) или с помощью других сервисов AWS, развернутых в том же VPC. Кроме того, инстансы HAQM EC2 или другие сервисы AWS из других VPC в том же регионе или других регионах могут обращаться к HAQM DocumentDB посредством пирингового подключения между VPC. Доступ к кластерам HAQM DocumentDB нужно выполнять через оболочку mongo или драйверы MongoDB. При подключении к кластеру сервис HAQM DocumentDB запрашивает аутентификацию. Подробнее о дополнительных вариантах см. в разделе о подключении к кластеру HAQM DocumentDB извне HAQM VPC.

Для предоставления некоторых возможностей управления, включая управление жизненным циклом инстансов, шифрование данных при хранении с использованием ключей Сервиса управления ключами HAQM (KMS) и управление группами безопасности, HAQM DocumentDB использует ту же операционную технологию, что применяется в Службе реляционных баз данных HAQM (RDS) и HAQM Neptune. При использовании CLI API AWS для describe-db-instances и describe-db-clusters мы рекомендуем фильтровать ресурсы HAQM DocumentDB с указанием следующего параметра: «--filter Name=engine,Values=docdb».

Актуальная информация о доступных типах инстансов по регионам находится на странице цен на HAQM DocumentDB.

Чтобы попробовать работать с HAQM DocumentDB, изучите руководство по началу работы.

Производительность

Открыть все

Во время записи в хранилище HAQM DocumentDB сохраняет только журналы с упреждающей записью и не требует записи полной синхронизации буферных страниц. В результате такой оптимизации, не влияющей на надежность, операции записи в HAQM DocumentDB обычно исполняются быстрее, чем в традиционных базах данных. Кластеры HAQM DocumentDB способны масштабироваться до миллионов операций чтения в секунду и до 15 реплик чтения.

Актуальная информация по регионам и ценам находится на странице цен на HAQM DocumentDB.

Да, вы можете пользоваться бесплатной пробной версией HAQM DocumentDB в течение 1 месяца. Если вы ранее не пользовались HAQM DocumentDB, то имеете право пользоваться бесплатной пробной версией в течение 1 месяца. Ваша организация получит 750 часов использования инстансов t3.medium в месяц, 30 млн операций ввода-вывода, 5 ГБ хранилища и 5 ГБ хранилища резервных копий бесплатно на 30 дней. По окончании действия бесплатной пробной версии (один месяц) или при превышении объема разрешенного использования можно остановить кластер, чтобы избежать затрат, или продолжить его использование с оплатой согласно стандартному тарифу по требованию. Дополнительную информацию см. на странице бесплатной пробной версии DocumentDB.

Конфигурация HAQM DocumentDB, оптимизированная для ввода-вывода – идеальный выбор, если вы хотите контролировать свои затраты или у имеете приложения с высокой частотой операций ввода-вывода. Если вы ожидаете, что затраты на ввод-вывод превысят 25 % от общей стоимости базы данных HAQM DocumentDB, это будет наилучшим вариантом в плане соотношения цены и производительности. Дополнительные сведения, включая инструкции по началу работы, см. в нашей документации по конфигурации HAQM DocumentDB, оптимизированной для ввода-вывода.

Вы можете переключать существующие кластеры баз данных раз в 30 дней на оптимизированную для ввода-вывода конфигурацию HAQM DocumentDB. В любой момент можно вернуться к стандартным конфигурациям хранилища HAQM DocumentDB.

Да, плата за операции ввода-вывода, необходимые для репликации данных в разных регионах, продолжает взиматься. За операции ввода-вывода для чтения и записи, что отличаются от репликации данных, в оптимизированной для ввода-вывода конфигурации HAQM DocumentDB плата не взимается. Дополнительные сведения см. в нашей документации по HAQM DocumentDB, оптимизированной для ввода-вывода.

Эластичные кластеры

Открыть все

Эластичные кластеры HAQM DocumentDB обеспечивают эластичное масштабирование базы данных документов для обработки миллионов операций записи и чтения до объема, исчисляемого в петабайтах. Эластичные кластеры упрощают взаимодействие клиентов с HAQM DocumentDB, автоматически управляя базовой инфраструктурой и устраняя потребность в создании, удалении, обновлении и масштабировании инстансов.

Вы можете создать эластичный кластер с помощью API, SDK, интерфейса командной строки HAQM DocumentDB, CloudFormation (CFN) или консоли AWS. При выделении кластера вы указываете, сколько сегментов и вычислительных мощностей на сегмент нужно для рабочей нагрузки. После создания кластера вы готовы приступить к использованию масштабируемости эластичных кластеров. Теперь вы можете подключаться к эластичному кластеру и читать или записывать данные прямо в своем приложении. Эластичные кластеры являются эластичными. В зависимости от потребностей рабочей нагрузки вы можете добавлять или удалять вычислительные мощности, изменяя количество сегментов и количество вычислительных мощностей в кластере с помощью консоли, API, командной строки или SDK AWS. Эластичные кластеры будут автоматически выделять и отменять выделение базовой инфраструктуры и перераспределять данные.

Эластичные кластеры используют сегментирование для распределения данных в распределенной системе хранилища HAQM DocumentDB. В ходе сегментирования, которое также называется разбиением, крупные наборы данных разделяются на небольшие наборы данных на множестве узлов, что позволяет пользователям масштабировать базу данных, преодолевая ограничения вертикального масштабирования цельной базы данных. Эластичные кластеры отделяют вычислительные мощности от хранилища в HAQM DocumentDB. Вместо того чтобы перераспределять коллекции, перемещая небольшие фрагменты данных между вычислительными узлами, эластичные кластеры могут эффективно копировать данные в распределенной системе хранения.

Эластичные кластеры поддерживают разбиение на основе хэша.

Используя эластичные кластеры, вы можете с легкостью проводить масштабирование в рабочей нагрузке в HAQM DocumentDB обычно без простоя или с минимальным простоем приложений и снижения производительности, независимо от размера данных. Подобная операция в MongoDB снижает производительность приложения и длится часами, а иногда даже днями. Кроме того, эластичные кластеры предоставляют возможности дифференцированного управления, например резервное копирование без снижения производительности и быстрое восстановление на момент времени, позволяя клиентам уделять основное внимание работе с приложением, а не управлению базой данных.

Нет. Вам не нужно вносить изменения в свое приложение, чтобы использовать эластичные кластеры.

Нет, в ближайшем будущем вы можете использовать Сервис миграции баз данных AWS (DMS) для переноса данных из существующего кластера HAQM DocumentDB в эластичный кластер.

Выбор оптимального ключа сегмента для эластичных кластеров не отличается от других баз данных. Хороший ключ сегмента отличается двумя характеристиками: высокой частотой и высокой мощностью. Например, если ваше приложение хранит user_orders в DocumentDB, то обычно данные должен получать пользователь. Поэтому вы хотите, чтобы все заказы, связанные с определенным пользователем, хранились в одном сегменте. В таком случае хорошим ключом сегмента будет user_id. Подробнее... 

  • Эластичный кластер – кластер HAQM DocumentDB, позволяющий масштабировать пропускную способность рабочей нагрузки до миллионов операций чтения-записи в секунду, а размер хранилища – до петабайтов. Эластичный кластер состоит из одного или нескольких сегментов для томов вычислений и хранения данных и по умолчанию отличается высокой доступностью в нескольких зонах доступности.
  • Сегмент выполняет вычисления для эластичного кластера. По умолчанию сегмент состоит из двух узлов: одного узла чтения или записи и одного резервного узла, которые будут использоваться в качестве целевого для аварийного переключения. У вас может быть максимум 32 сегмента, в каждом из которых может быть максимум 64 виртуальных ЦПУ.
  • Ключ сегмента – необязательное поле в документах JSON, используемое эластичными кластерами для направления трафика чтения и записи на соответствующий компьютер. Советуем выбирать ключи, которые содержат множество уникальных значений. Хороший ключ сегмента будет равномерно распределять данные между множеством базовых сегментов, обеспечивая наивысшую пропускную способность и производительность рабочей нагрузки. 
  • Сегментированная коллекция – коллекция, данные в которой распределены по эластичному кластеру.

Эластичные кластеры интегрируются с другими сервисами AWS таким же способом, как это сейчас делает DocumentDB. Во-первых, вы можете воспользоваться Сервисом миграции баз данных AWS (DMS) для миграции с MongoDB и других реляционных баз данных на эластичные кластеры. Во-вторых, вы можете отслеживать производительность эластичного кластера с помощью HAQM CloudWatch. В-третьих, вы можете настроить аутентификацию и авторизацию через пользователей и роли AWS IAM и использовать AWS VPC для безопасных подключений только к облакам VPC. Наконец, вы можете использовать AWS Glue для импорта данных из других сервисов AWS и их экспорта в другие сервисы AWS, в частности S3, Redshift и OpenSearch.

Да. Вы можете выполнить миграцию сегментированных рабочих нагрузок MongoDB в эластичные кластеры. Вы можете либо воспользоваться Сервисом миграции баз данных AWS или встроенными инструментами MongoDB, такими как mongodump и mongorestore, для миграции своей рабочей нагрузки MongoDB в эластичные кластеры. Также эластичные кластеры поддерживают широко используемые API MongoDB, такие как shardCollection(), обеспечивая гибкость повторного использования существующих инструментов и сценариев в HAQM DocumentDB.

Оборудование, масштабирование и хранилище

Открыть все

Минимальный объем хранилища – 10 ГБ. По мере использования кластера хранилище HAQM DocumentDB может, не снижая производительности, автоматически расширяться до 128 ТиБ с шагом в 10 ГБ. При использовании эластичных кластеров HAQM DocumentDB хранилище будет автоматически расти до 4 ПБ с шагом в 10 ГБ. В любом случае выделять хранилище заранее не требуется.

Масштабирование HAQM DocumentDB выполняется по двум направлениям: для хранилища и для вычислительных ресурсов. Хранилище HAQM DocumentDB автоматически масштабируется с 10 ГБ до 128 ТиБ в кластерах на базе инстансов и до 4 PiB для эластичных кластеров HAQM DocumentDB. Вычислительные ресурсы HAQM DocumentDB можно масштабировать путем использования более крупных инстансов или же горизонтально (для повышения производительности при чтении), т. е. путем добавления в кластер дополнительных инстансов‑реплик.

Вычислительные ресурсы, выделенные инстансу, можно масштабировать в Консоли управления AWS, выбрав нужный инстанс и нажав кнопку «Modify» (Изменить). Масштабирование ресурсов памяти и ЦПУ выполняется за счет изменения класса инстанса.

После изменения класса инстанса запрошенные изменения вступают в силу в течение настроенного окна обслуживания. Как вариант, можно установить флажок «Apply Immediately» (Применить сразу) для немедленного выполнения запроса на масштабирование. В обоих случаях это снизит доступность БД на несколько минут, в течение которых выполняется масштабирование. Имейте в виду, что одновременно будут применены любые другие ожидающие применения системные изменения.

Резервное копирование и восстановление

Открыть все

Автоматическое резервное копирование для кластеров в HAQM DocumentDB включено всегда. Простая возможность резервного копирования базы данных в HAQM DocumentDB обеспечивает восстановление кластера на момент времени. Интервал резервного копирования для восстановления на момент времени можно увеличить до 35 дней. Резервное копирование не влияет на производительность базы данных.

Да. Созданные вручную снимки состояния можно хранить дольше, чем предусмотрено интервалом резервного копирования. Создание снимков состояния не влияет на производительность. Учтите, что восстановление данных из снимков состояния кластера требует создания нового кластера.

HAQM DocumentDB автоматически обеспечивает долговечность данных в трех зонах доступности в пределах региона и автоматически пытается восстановить ваш инстанс в работоспособной зоне доступности без потери данных. В маловероятном случае, когда данные в хранилище HAQM DocumentDB становятся недоступны, можно восстановить их в новый кластер из снимка состояния кластера или выполнить операцию восстановления на момент времени. Имейте в виду, что последнее доступное время восстановления при операции восстановления на момент времени может отставать от текущего на несколько минут (не более пяти).

Система предлагает создать снимок финального состояния при удалении инстанса. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного инстанса. После удаления инстанса сервис HAQM DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную. При этом после удаления сохраняются только снимки состояния (то есть созданные автоматически резервные копии для восстановления на момент времени не сохраняются).

При удалении аккаунта AWS все созданные автоматически резервные копии и резервные копии снимков состояния, содержащиеся в аккаунте, будут удалены.

Да. HAQM DocumentDB предоставляет возможность создавать снимки состояния кластера, которые в дальнейшем можно использовать для его восстановления. Снимок можно предоставить в совместное использование для другого аккаунта AWS, при этом владелец такого аккаунта сможет использовать этот снимок для восстановления кластера, содержащего ваши данные. Снимок состояния можно сделать даже публичным – в этом случае любой пользователь сможет восстановить кластер, содержащий соответствующие публичные данные. Эту возможность можно применять для совместного использования данных разными средами (рабочей средой, средой разработки и тестирования, промежуточной средой и т. д.), когда они относятся к разным аккаунтам AWS, а также для того, чтобы безопасно хранить резервные копии всех данных в нескольких аккаунтах на тот случай, если используемый главный аккаунт AWS будет взломан.

За совместное использование снимка состояния несколькими аккаунтами плата не взимается. При этом плата может начисляться за сам снимок состояния, а также за любой кластер, восстановленный из совместно используемых снимков состояния.

Совместное использование автоматически созданных снимков состояния кластера не поддерживается. Для совместного использования автоматически созданных снимков состояния нужно вручную создать копию снимка состояния и сделать его общим.

Нет. Совместно используемые снимки состояния HAQM DocumentDB будут доступны только для аккаунтов, которые находятся в том же регионе, что и аккаунт, предоставивший общий доступ к этим снимкам состояния.

Да. К зашифрованным снимкам состояния HAQM DocumentDB можно настроить совместный доступ. Получателю совместно используемого снимка состояния потребуется доступ к ключу KMS, использованному для шифрования этого снимка.

Нет, снимки состояния HAQM DocumentDB можно использовать только в пределах этого сервиса.

Вы можете создать итоговый снимок состояния при удалении кластера. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного кластера. После удаления кластера сервис HAQM DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную.

Высокая доступность и репликация

Открыть все

HAQM DocumentDB автоматически делит общий объем хранилища на сегменты по 10 ГБ, распределенные по нескольким дискам. Каждый 10‑гигабайтный блок хранилища шестикратно реплицируется в трех зонах доступности (AZ). HAQM DocumentDB обеспечивает автоматическую обработку потери до двух копий данных без снижения доступности операций записи и до трех копий без снижения доступности операций чтения. Кроме того, тома хранилища HAQM DocumentDB обладают способностью к самостоятельному восстановлению. Блоки данных и диски непрерывно сканируются на наличие ошибок и автоматически восстанавливаются.

Чтобы база данных HAQM DocumentDB стала доступна для операций после сбоя базы данных, в отличие от других БД, не требуется воспроизводить журнал повтора с последней контрольной точки базы данных (обычно этот процесс занимает пять минут) и проверять, все ли изменения были применены. Благодаря этому время перезапуска базы данных в большинстве случаев составляет менее 60 секунд. HAQM DocumentDB изолирует кэш от процессов базы данных и делает его мгновенно доступным уже во время перезагрузки. Это предотвращает необходимость регулировать доступ до тех пор, пока кэш не заполнен, во избежание сбоев доступа.

HAQM DocumentDB поддерживает реплики чтения, подключенные к тому же тому хранилища, что и основной инстанс. Сделанные в основном инстансе обновления видны всем репликам HAQM DocumentDB.

  • Возможность: реплики чтения HAQM DocumentDB
  • Количество реплик: до 15
  • Тип репликации: асинхронный (обычно на уровне миллисекунд)
  • Влияние на производительность основного инстанса: низкое
  • Возможность использования в качестве целевого объекта при обработке отказа: есть (без потери данных)
  • Возможность автоматической обработки отказа: есть

Да, реплицировать данные между регионами можно с помощью функции Global Cluster. Кластеры Global Clusters охватывают множество регионов AWS. Global Clusters реплицируют данные в кластеры пяти регионов, почти не влияя на производительность. Глобальные кластеры Global Clusters обеспечивают аварийное восстановление в результате сбоев в масштабе региона и чтение глобальных данных с низкой задержкой. Подробнее об этом можно прочитать в нашем блоге.

Да. Каждому инстансу в кластере можно присвоить приоритет использования. При отказе основного инстанса сервис HAQM DocumentDB назначает вместо него реплику с наивысшим приоритетом. Если две или более реплик имеют одинаковый уровень приоритета, сервис HAQM DocumentDB использует реплику, размер которой совпадает с размером основного инстанса.

Уровень приоритета инстанса можно изменять в любое время. Само по себе изменение уровня приоритета не приводит к запуску механизма отказоустойчивости.

Репликам, которые не планируется преобразовывать в основной инстанс, можно назначить более низкий уровень приоритета. Но если по какой‑либо причине реплики с высоким приоритетом в кластере неработоспособны или недоступны, HAQM DocumentDB будет использовать реплику с более низким приоритетом.

HAQM DocumentDB можно развертывать в высокодоступной конфигурации, используя инстансы‑реплики в нескольких зонах доступности AWS в качестве целевых объектов при обработке отказа. Если на основном инстансе происходит сбой, инстанс реплики автоматически становится новым основным инстансом. Данный процесс происходит с минимальными сбоями в работе сервиса.

Можно добавить дополнительные реплики HAQM DocumentDB. Реплики HAQM DocumentDB используют то же самое хранилище, что и основной инстанс. Любую реплику HAQM DocumentDB можно сделать основной без какой‑либо потери данных и, соответственно, использовать для повышения отказоустойчивости в случае сбоя основного инстанса. Для повышения доступности кластера просто создайте от 1 до 15 реплик в нескольких зонах доступности, и HAQM DocumentDB будет автоматически включать их в список выбора основного инстанса в случае его отказа.

HAQM DocumentDB обрабатывает отказы автоматически, чтобы приложения могли как можно скорее возобновлять операции с базами данных без ручного вмешательства администратора.

  • При наличии инстанса реплики HAQM DocumentDB в той же или в другой зоне доступности при обработке отказа сервис HAQM DocumentDB переадресует запись канонического имени (CNAME) инстанса так, чтобы она указывала на работоспособную реплику, которая, в свою очередь, становится основной. Обработка отказа обычно полностью выполняется за 30 секунд. 
  • При отсутствии инстанса реплики HAQM DocumentDB (т. е. при использовании кластера из одного инстанса) HAQM DocumentDB попытается создать новый инстанс в той же самой зоне доступности, что и исходный инстанс. Замена исходного инстанса выполняется на основе принципа «разумных усилий» и может не состояться, к примеру, если существует проблема, которая значительно влияет на зону доступности. 

В случае потери соединения приложение должно попытаться повторно подключиться к базе данных.

HAQM DocumentDB автоматически обнаружит проблему с основным инстансом и перенаправит трафик операций чтения / записи на инстанс реплики HAQM DocumentDB. В среднем обработка отказа в такой ситуации занимает 30 секунд. Кроме того, на короткий промежуток времени будет прерван трафик операций чтения, который обслуживали инстансы реплик HAQM DocumentDB.

Поскольку реплики HAQM DocumentDB используют тот же самый том данных, что и первичный инстанс, никакого отставания репликации практически не существует. По нашим наблюдениям, интервал отставания обычно сохраняется на уровне десятков миллисекунд.

Безопасность и соответствие требованиям

Открыть все

Да. Для этого все кластеры HAQM DocumentDB должны быть созданы в облаке VPC. HAQM VPC дает возможность определять топологию виртуальной сети, очень напоминающую традиционную сеть, которая могла бы работать в вашем собственном центре обработки данных. Это предоставляет нашим клиентам полный контроль над тем, кто получает доступ к их кластерам HAQM DocumentDB.

В HAQM DocumentDB реализована поддержка RBAC со встроенными ролями. RBAC позволяет принудительно применять рекомендованный доступ по принципу наименьших привилегий, ограничивая набор действий, которые разрешено выполнять пользователям. Подробнее об этом см. здесь.

HAQM DocumentDB использует строгие границы сети и авторизацию VPC. Аутентификация и авторизация в API управления HAQM DocumentDB осуществляется на основе пользователей, ролей и политик IAM. Аутентификация в базе данных HAQM DocumentDB осуществляется с помощью стандартных инструментов и драйверов MongoDB с использованием стандартного механизма аутентификации MongoDB: Salted Challenge Response Authentication Mechanism (SCRAM).

Да. HAQM DocumentDB поддерживает шифрование кластеров с использованием ключей, управление которыми осуществляется в Сервисе управления ключами AWS (AWS KMS). В кластере HAQM DocumentDB с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также их автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. Шифрование и дешифрование осуществляются незаметно для пользователя. Дополнительную информацию об использовании KMS с HAQM DocumentDB см. в разделе о шифровании данных HAQM DocumentDB при хранении.

На данный момент шифрование существующего незашифрованного кластера HAQM DocumentDB не поддерживается. Чтобы использовать шифрование HAQM DocumentDB для существующего незашифрованного кластера, создайте новый кластер с включенным шифрованием и перенесите данные в него.

Сервис HAQM DocumentDB разработан в соответствии в самыми строгими стандартами безопасности, что позволяет клиентам проверить наш уровень безопасности и выполнить свои обязательства по соответствию нормативным требованиям. Проверка HAQM DocumentDB показала его соответствие стандартам PCI DSS, ISO 9001, 27001, 27017 и 27018, SOC 1, 2 и 3, а также сертификации Health Information Trust Alliance (HITRUST) Common Security Framework (CSF). Кроме того, этот сервис соответствует требованиям HIPAA. Отчеты по соответствию AWS требованиям можно скачать в AWS Artifact.

Обновление основной версии

Открыть все

С помощью местного обновления можно актуализировать кластеры HAQM DocumentDB 3.6 или 4.0 до HAQM DocumentDB 5.0 посредством консоли AWS, пакета средств разработки ПО (SDK) или интерфейса командной строки (CLI). Благодаря этому нет необходимости создавать новые кластеры или менять конечные точки. Местное обновление основной версии доступно во всех регионах, где есть HAQM DocumentDB 5.0. Для того чтобы начать работу с местным обновлением основной версии, ознакомьтесь с его документацией.

Оно позволяет легко актуализировать кластеры HAQM DocumentDB 3.6 или 4.0 до версии 5.0 без необходимости выполнять резервное копирование, восстановление в другой кластер и без использования иных инструментов миграции данных. Таким образом, это сокращает время и количество усилий, которые нужны для обычного процесса обновления с настройкой исходных и целевых конечных точек, миграцией индексов и данных, изменением кода приложения и многим другим.

После обновления вам не нужно будет менять конечную точку в своих приложениях. Поскольку данные остаются в том же кластере, дополнительная плата за функцию не взимается.

Время простоя может варьироваться в зависимости от количества коллекций, индексов, баз данных и инстансов. Прежде чем запускать местное обновление основной версии производственного кластера, мы настоятельно рекомендуем сперва сделать это в среде тестирования, чтобы проверить время простоя, производительность, а также убедиться в том, что приложения работают должным образом.

Можно также использовать функцию быстрого клонирования HAQM DocumentDB, чтобы скопировать данные из кластера для тестирования. Вы можете обратиться за дополнительной помощью к нашему архитектору решений для баз данных, если у вас возникнут сложности с внедрением HAQM DocumentDB.

Местное обновление доступно только в HAQM DocumentDB 3.6 или 4.0 в качестве отправной точки и версии 5.0 в качестве конечной точки. Но оно недоступно для глобальных или эластичных кластеров HAQM DocumentDB, а также DocumentDB 4.0 в качестве конечной точки.

Машинное обучение

Открыть все

HAQM DocumentDB поддерживает интеграцию с HAQM SageMaker Canvas, что упрощает создание моделей машинного обучения и настройку базовых моделей с использованием данных из HAQM DocumentDB без единой строки кода. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между HAQM DocumentDB и SageMaker Canvas. Вы можете запустить SageMaker Canvas из консоли HAQM DocumentDB и добавить существующие базы данных HAQM DocumentDB в качестве источника данных, чтобы приступить к созданию моделей машинного обучения. Данные из DocumentDB в SageMaker Canvas можно использовать для создания моделей прогнозирования оттока клиентов, сбоев в обслуживании, финансовых показателей и продаж, выявления мошенничества, оптимизации запасов, обобщения и создания контента.

HAQM SageMaker Canvas предлагает интерфейс без программирования для создания моделей машинного обучения с использованием данных из различных источников, включая HAQM DocumentDB. С вас взимается плата за использование SageMaker Canvas и за операции ввода-вывода при чтении данных из инстанса HAQM DocumentDB, осуществляемого SageMaker Canvas. За использование DocumentDB в качестве источника данных для HAQM SageMaker Canvas дополнительная плата не взимается. Подробнее см. на страницах цен на HAQM DocumentDB и SageMaker Canvas.

Генеративный искусственный интеллект и машинное обучение

Открыть все

Векторный поиск для HAQM DocumentDB сочетает гибкость и широкие возможности запросов, присущие базе данных документов на основе JSON, которая оснащена векторным поиском. Можно использовать существующие данные HAQM DocumentDB или гибкую структуру данных документов для создания сценариев использования машинного обучения и генеративного искусственного интеллекта, таких как семантический поиск, рекомендации по продуктам, персонализация, чат-боты, обнаружение мошенничества и аномалий. Дополнительные сведения см. в документации по векторному поиску для HAQM DocumentDB.

Векторный поиск для HAQM DocumentDB позволяет использовать семантический поиск, чтобы уловить смысл, контекст и цель ваших данных. Поиск по ключевым словам позволяет найти документ на основе фактического текста или предопределенных сопоставлений синонимов. Например, в традиционном приложении интернет-магазина по запросу «красное платье» могут быть найдены товары, в описании которых есть слова «красное» и «платье». Семантический поиск позволит получить результаты с платьями разных оттенков красного, что повышает удобство использования.  

Использование векторного поиска для HAQM DocumentDB не требует дополнительных затрат. При хранении, индексировании и поиске векторов в HAQM DocumentDB будет взиматься стандартная плата за вычисления, ввод-вывод, хранение и резервное копирование. Подробные сведения см. на странице цен на HAQM DocumentDB.

HAQM DocumentDB интегрируется с HAQM SageMaker Canvas, что упрощает создание приложений на основе генеративного искусственного интеллекта (ИИ) и машинного обучения (МО) с использованием данных, хранящихся в HAQM DocumentDB. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между HAQM DocumentDB и SageMaker Canvas. Интеграция в консоль устраняет необходимость в подключении и доступе к данным, что позволяет ускорить разработку машинного обучения без необходимости писать код. Вы можете запустить SageMaker Canvas из консоли HAQM DocumentDB и добавить существующие базы данных HAQM DocumentDB в качестве источника данных.

Интеграция с нулевым использованием ETL

Открыть все

Интеграция с сервисом HAQM OpenSearch с нулевым использованием ETL позволяет устранить операционные сложности, связанные с извлечением, преобразованием и загрузкой данных из коллекции HAQM DocumentDB в управляемый кластер или бессерверную коллекцию HAQM OpenSearch. Благодаря этой интеграции вам больше не придется создавать конвейеры данных, управлять ими или преобразовывать их содержание.

Если вы хотите использовать API MongoDB, следует применять возможности встроенных баз данных HAQM DocumentDB для выполнения векторного поиска среди документов. Интеграция HAQM DocumentDB с сервисом HAQM OpenSearch с нулевым использованием ETL – отличный вариант для поиска по коллекциям, а также для хранения и индексирования векторов с более чем 2000 измерениями.

При интеграции HAQM DocumentDB с сервисом HAQM OpenSearch с нулевым использованием ETL применяется HAQM OpenSearch Ingestion, что позволяет беспрепятственно перемещать операционные данные из HAQM DocumentDB в сервис HAQM OpenSearch. Сначала следует включить функцию изменения потока в коллекции HAQM DocumentDB, которую вы планируете реплицировать. Функция интеграции с нулевым использованием ETL настраивает конвейер HAQM OpenSearch Ingestion в вашем аккаунте, который автоматически реплицирует данные в управляемый кластер сервиса HAQM OpenSearch или бессерверную коллекцию.

HAQM OpenSearch Ingestion автоматически определяет формат данных в коллекциях HAQM DocumentDB и сопоставляет данные с сервисом HAQM OpenSearch для наиболее эффективных результатов поиска. Можно синхронизировать данные из нескольких коллекций HAQM DocumentDB с помощью разных конвейеров в один управляемый кластер или бессерверную коллекцию HAQM OpenSearch, чтобы получить целостную аналитику по нескольким приложениям. Дополнительно можно указать собственные процессоры данных при определении конфигурации получения данных в сервисе HAQM OpenSearch. Последующие обновления коллекций DocumentDB также реплицируются в сервис HAQM OpenSearch без вмешательства в ручном режиме.

Интеграция с нулевым использование ETL работает на встроенных возможностях преобразования данных конвейеров HAQM OpenSearch Ingestion для агрегации и фильтрации данных во время их перемещения.

Можно написать пользовательский алгоритм преобразования, если вам требуется специализированная функция, а HAQM OpenSearch Ingestion будет управлять самим процессом преобразования. Кроме того, если необходимо без дополнительной настройки перенести все данные из источника в получатель, HAQM OpenSearch Ingestion предоставляет готовые чертежи, с помощью которых можно выполнять интеграцию всего несколькими щелчками мыши.

Чтобы HAQM OpenSearch Ingestion предоставлялись необходимые разрешения на репликацию данных с HAQM DocumentDB, функция интеграции с нулевым использованием ETL создает роль IAM с необходимыми разрешениями для чтения данных коллекции HAQM DocumentDB, а также записи в домен или коллекцию HAQM OpenSearch. Затем эту роль берут на себя конвейеры получения данных HAQM OpenSearch, гарантирующие постоянное соблюдение надлежащего уровня безопасности при перемещении данных от источника к конечной точке.

Все метрики по интеграции с HAQM DocumentDB с нулевым использованием ETL, можно просмотреть на консольных панелях, предоставленных в конвейерах HAQM DocumentDB и OpenSearch Ingestion. В HAQM CloudWatch также можно запрашивать журналы в реальном времени и настраивать собственные оповещения, которые запускаются при превышении заданных пользователем пороговых значений.