Perguntas frequentes sobre o HAQM DocumentDB (compatível com MongoDB)

Geral

Abrir tudo

O HAQM DocumentDB (compativel com MongoDB) é um serviço de banco de dados de documentos empresarial rápido, escalável, altamente disponível e totalmente gerenciado que oferece suporte a workloads JSON. Como banco de dados de documentos, o HAQM DocumentDB facilita o armazenamento, a consulta e a indexação de dados JSON. Os desenvolvedores podem usar o mesmo código, drivers e ferramentas de aplicações MongoDB que usam hoje para executar, gerenciar e dimensionar workloads no HAQM DocumentDB. Desfrute de melhor performance, escalabilidade e disponibilidade sem se preocupar com o gerenciamento da infraestrutura subjacente.

Os clientes podem usar o AWS Database Migration Service (DMS) para migrar facilmente bancos de dados não relacionais do MongoDB on-premises ou no HAQM Elastic Compute Cloud (EC2) para o HAQM DocumentDB sem praticamente nenhum tempo de inatividade. Não há investimentos adiantados para usar o HAQM DocumentDB. Os clientes pagam apenas pela capacidade utilizada.

Os bancos de dados orientados a documentos são uma das categorias de bancos de dados noSQL que mais crescem, sendo que o principal motivo é que os bancos de dados de documentos oferecem esquemas flexíveis e amplos recursos de consulta. O modelo de documento é uma ótima opção para casos de uso com conjuntos de dados dinâmicos que exigem consulta, indexação e agregações ad-hoc. Com a escala que o HAQM DocumentDB oferece, ele é usado por uma ampla variedade de clientes para casos de uso como gerenciamento de conteúdo, personalização, catálogos, aplicações móveis e da Web, IoT e gerenciamento de perfis.

“Compatível com MongoDB” significa que o HAQM DocumentDB interage com as APIs de código aberto do MongoDB 3.6, 4.0 e 5.0 do Apache 2.0. Como resultado, você pode usar os mesmos drivers, aplicações e ferramentas do MongoDB com o HAQM DocumentDB com poucas, ou nenhuma, mudanças. Enquanto o HAQM DocumentDB suporta a grande maioria das APIs do MongoDB que os clientes costumam usar, ele não suporta todas as APIs do MongoDB. Nosso foco tem sido entregar recursos que os clientes realmente usam e precisam.

Desde o lançamento, continuamos a trabalhar com base nas necessidades dos clientes e entregamos mais de 80 recursos adicionais, incluindo compatibilidade, transações e fragmentação com o MongoDB 4.0 e 5.0. Para saber mais sobre as APIs do MongoDB compatíveis, consulte a documentação de compatibilidade. Para saber mais sobre lançamentos recentes do HAQM DocumentDB, consulte “Anúncios do HAQM DocumentDB” na página de recursos do HAQM DocumentDB.

Não. O HAQM DocumentDB não utiliza qualquer código SSPL do MongoDB, assim, ele não é restringido por essa licença. Em vez disso, o HAQM DocumentDB interage com as APIs de código aberto do MongoDB 3.6, 4.0 e 5.0 do Apache 2.0. Continuaremos a ouvir e trabalhar a partir das necessidades de nossos clientes para entregar os recursos que eles precisarem. Para saber mais sobre as APIs do MongoDB compatíveis, consulte a documentação de compatibilidade. Para saber mais sobre lançamentos recentes do HAQM DocumentDB, consulte “Anúncios do HAQM DocumentDB” na página de recursos do HAQM DocumentDB.

Os clientes podem usar o AWS Database Migration Service (DMS) para migrar facilmente bancos de dados do MongoDB on-premises ou no HAQM Elastic Compute Cloud (EC2) para o HAQM DocumentDB sem praticamente qualquer tempo de inatividade. Com o DMS, é possível migrar de um conjunto de réplicas do MongoDB ou de um cluster fragmentado para o HAQM DocumentDB. Além disso, você pode usar a maioria das ferramentas existentes para migrar dados de um banco de dados do MongoDB para o HAQM DocumentDB, como mongodump/mongorestore, mongoexport/mongoimport e ferramentas de terceiros que oferecem suporte à Change Data Capture (CDC – Captura de dados de alteração) por meio do oplog. Para obter mais informações, consulte Migrar para o HAQM DocumentDB.

Não, o HAQM DocumentDB funciona com a grande maioria dos drivers do MongoDB compatíveis com o MongoDB 3.4 ou superior.

Sim. Com o lançamento do suporte para compatibilidade com MongoDB 4.0, o HAQM DocumentDB oferece suporte à capacidade de realizar transações de atomicidade, consistência,isolamento e durabilidade(ACID) em vários documentos, instruções, coleções e bancos de dados.

Não, o HAQM DocumentDB não segue os mesmos ciclos de vida de suporte do MongoDB, e a programação de EOL do MongoDB não se aplica ao HAQM DocumentDB.

Os clusters do HAQM DocumentDB são implantados em uma HAQM VPC (VPC) do cliente e podem ser acessados diretamente por instâncias do HAQM Elastic Compute Cloud (EC2) ou outros serviços da AWS implantados na mesma VPC. Além disso, o HAQM DocumentDB pode ser acessado por instâncias do HAQM EC2 ou outros serviços da AWS em VPCs diferentes na mesma ou em outras regiões por meio do emparelhamento da VPC. O acesso aos clusters do HAQM DocumentDB deve ser feito por meio do mongo shell ou com os drivers do MongoDB. O HAQM DocumentDB exige autenticação para conexão a um cluster. Para opções adicionais, consulte Estabelecer conexão com um cluster do HAQM DocumentDB de fora de uma HAQM VPC.

Para determinados recursos de gerenciamento, como gerenciamento do ciclo de vida de instâncias, criptografia de dados ociosos com chaves do HAQM Key Management Service (KMS) e gerenciamento de grupos de segurança, o HAQM DocumentDB utiliza uma tecnologia operacional que é compartilhada com o HAQM Relational Database Service (RDS) e o HAQM Neptune. Ao usar as APIs describe-db-instances e describe-db-clusters da AWS CLI, recomendamos filtrar os recursos do HAQM DocumentDB usando o seguinte parâmetro: "--filter Name=engine,Values=docdb".

Consulte a página de preços do HAQM DocumentDB para obter informações atualizadas sobre os tipos de instância disponíveis por região.

Para experimentar o HAQM DocumentDB, visite o guia Conceitos básicos.

Performance

Abrir tudo

Ao gravar no armazenamento, o HAQM DocumentDB persiste apenas um log write-ahead e não precisa gravar sincronizações completas de páginas de buffer. Como resultado dessa otimização, que não compromete a resiliência, as gravações do HAQM DocumentDB são normalmente mais rápidas que as dos bancos de dados tradicionais. A escala dos clusters do HAQM DocumentDB pode ser aumentada horizontalmente até milhões de leituras por segundo com até 15 réplicas de leitura.

Preços

Abrir tudo

Consulte a página de preços do HAQM DocumentDB para obter informações atualizadas sobre regiões e preços.

Sim, você pode experimentar o HAQM DocumentDB gratuitamente usando um teste gratuito por um mês. Caso ainda não tenha usado o HAQM DocumentDB, você está qualificado para um mês gratuito de teste. Sua organização recebe 750 horas por mês de uso da instância t3.medium, 30 milhões de ESs, 5 GB de armazenamento e 5 GB de armazenamento de backup gratuitamente por 30 dias. Assim que o teste gratuito de um mês expirar ou seu uso exceder a franquia gratuita, você poderá encerrar o cluster para evitar cobranças ou mantê-lo funcionando de acordo com nossas taxas padrão sob demanda. Para saber mais, consulte a página de teste gratuito do DocumentDB.

O HAQM DocumentDB I/O-Optimized é a escolha ideal quando você precisa de custos previsíveis ou tem aplicações com uso intensivo de E/S. Se você espera que seus custos de E/S excedam 25% dos custos totais do banco de dados HAQM DocumentDB, essa opção oferece melhor custo-benefício. Consulte a documentação do HAQM DocumentDB com E/S Otimizada para saber mais, incluindo como começar.

Você pode mudar os clusters de banco de dados existentes uma vez a cada 30 dias para o HAQM DocumentDB I/O-Optimized. Você pode voltar às configurações de armazenamento padrão do HAQM DocumentDB a qualquer momento.

Sim, as cobranças pelas operações de E/S necessárias para replicar dados entre regiões continuam sendo aplicadas. O HAQM DocumentDB I/O-Optimized não cobra pelas operações de E/S de leitura e gravação, o que é diferente da replicação de dados. Consulte a documentação do HAQM DocumentDB com E/S Otimizada para saber mais.

Elastic Clusters

Abrir tudo

O HAQM DocumentDB Elastic Clusters permite que você escale elasticamente seu banco de dados de documentos para lidar com milhões de gravações e leituras, com petabytes de capacidade de armazenamento. O Elastic Clusters simplifica a maneira como os clientes interagem com o HAQM DocumentDB, gerenciando automaticamente a infraestrutura subjacente e eliminando a necessidade de criar, remover, atualizar ou escalar instâncias.

Você pode criar um cluster do Elastic Clusters usando a CLI, o SDK, a API do HAQM DocumentDB, o CloudFormation (CFN) ou o console da AWS. Ao provisionar seu cluster, especifique quantos fragmentos e a computação por fragmento são necessários para sua workload. Depois de criar seu cluster, você estará pronto para começar a aproveitar a escalabilidade elástica do Elastic Clusters. Agora, é possível conectar-se ao cluster do Elastic Clusters e ler ou gravar dados da sua aplicação. O Elastic Clusters é elástico. Dependendo das necessidades da sua workload, você pode adicionar ou remover computação, modificando sua contagem de fragmentos e/ou computação por fragmento com o uso do console, da API, da CLI ou do SDK da AWS. O Elastic Clusters provisionará ou desprovisionará automaticamente a infraestrutura subjacente e rebalanceará seus dados.

O Elastic Clusters usa fragmentação para particionar dados no sistema de armazenamento distribuído do HAQM DocumentDB. O processo de fragmentação, também conhecido como particionamento, divide grandes conjuntos de dados em pequenos conjuntos de dados entre vários nós, permitindo que os clientes expandam seu banco de dados além dos limites de aumento de escala horizontal de um único banco de dados. O Elastic Clusters utiliza a separação entre computação e armazenamento no HAQM DocumentDB. Em vez de reparticionar coleções movendo pequenos blocos de dados entre nós de computação, o Elastic Clusters pode copiar dados de maneira eficiente dentro do sistema de armazenamento distribuído.

O Elastic Clusters oferece suporte ao particionamento baseado em hash.

Com o Elastic Clusters, você pode facilmente aumentar ou reduzir a escala da sua workload horizontalmente no HAQM DocumentDB, normalmente com pouco ou nenhum tempo de inatividade da aplicação ou impacto sobre a performance, independentemente do tamanho dos dados. Uma operação semelhante no MongoDB afetaria a performance da aplicação e demoraria horas e, em alguns casos, dias. O Elastic Clusters também oferece recursos de gerenciamento diferenciados, como backups sem impacto e restauração rápida pontual, permitindo que os clientes se concentrem mais em suas aplicações em vez de gerenciar seus bancos de dados.

Não. Você não precisa fazer alterações na sua aplicação para usar o Elastic Clusters.

Não. Em curto prazo, você poderá aproveitar o serviço AWS Database Migration (DMS) para migrar dados de um cluster HAQM DocumentDB existente para um cluster do Elastic Clusters.

Escolher uma chave de fragmento ideal para o Elastic Clusters não é diferente em comparação a outros bancos de dados. Uma chave de fragmento ideal tem duas características: alta frequência e alta cardinalidade. Por exemplo, se a sua aplicação armazena user_orders no DocumentDB, geralmente você precisa recuperar os dados por usuário. Portanto, você deseja que todos os pedidos relacionados a um determinado usuário estejam em um só fragmento. Nesse caso, user_id seria uma boa chave de fragmento. Leia mais informações

  • Elastic Clusters: um cluster do HAQM DocumentDB que permite escalar a throughput da sua workload para milhões de leituras/gravações por segundo e o armazenamento para petabytes. Um cluster do Elastic Cluster é composto por um ou mais fragmentos para computação e um volume de armazenamento e, por padrão, está altamente disponível em várias zonas de disponibilidade.
  • Fragmento: um fragmento fornece computação para o cluster do Elastic Clusters. Por padrão, um fragmento terá dois nós, um nó de leitor/gravador e um nó em espera que serão usados como destino de failover. É possível ter no máximo 32 fragmentos, e cada um pode ter no máximo 64 vCPUs.
  • Chave de fragmento: a chave de fragmento é um campo opcional nos seus documentos JSON que o Elastic Clusters utiliza para distribuir o tráfego de leitura e gravação ao fragmento correspondente. É recomendável escolher uma chave que tenha muitos valores exclusivos. Uma boa chave de fragmentação particionará uniformemente seus dados nos fragmentos subjacentes, proporcionando à sua workload os melhores níveis de throughput e performance. 
  • Coleção fragmentada: uma coleção cujos dados são distribuídos em um cluster do Elastic Clusters.

O Elastic Clusters se integra a outros serviços da AWS da mesma forma que o DocumentDB faz atualmente. Primeiro, você pode usar o AWS Database Migration Service (DMS) para migrar do MongoDB e de outros bancos de dados relacionais para o Elastic Clusters. Segundo, você pode monitorar a integridade e a performance do seu cluster do Elastic Clusters usando o HAQM CloudWatch. Terceiro, você pode configurar a autenticação e a autorização por meio de usuários e perfis do AWS IAM e usar a AWS VPC para conexões seguras somente para VPC. Por último, você pode usar o AWS Glue para importar e exportar dados de/para outros serviços da AWS, como o S3, o Redshift e o OpenSearch.

Sim. Você pode migrar suas workloads fragmentadas existentes do MongoDB para o Elastic Clusters. É possível usar o AWS Database Migration Service ou ferramentas nativas do MongoDB, como mongodump e mongorestore, para migrar sua workload do MongoDB para o Elastic Clusters. O Elastic Clusters também oferece suporte às APIs comumente usadas do MongoDB, como shardCollection(), oferecendo a você a flexibilidade de reutilizar ferramentas e scripts existentes com o HAQM DocumentDB.

Hardware, escalabilidade e armazenamento

Abrir tudo

O armazenamento mínimo é de 10 GB. Com base na utilização do seu cluster, seu armazenamento do HAQM DocumentDB aumentará automaticamente até 128 TiB, em incrementos de 10 GB, sem afetar a performance. Com o HAQM DocumentDB Elastic Clusters, o armazenamento crescerá automaticamente até 4 PiB em incrementos de 10 GB. Em ambos os casos, não há necessidade de provisionar o armazenamento com antecedência.

O HAQM DocumentDB é escalado em duas dimensões: armazenamento e computação. O armazenamento do HAQM DocumentDB é escalado automaticamente de 10 GB para 128 TiB em relação a clusters baseados em instâncias e até 4 PiB para clusters elásticos do HAQM DocumentDB. A capacidade computacional do HAQM DocumentDB pode ter um aumento na escala vertical, criando instâncias maiores, e na escala horizontal (para aumentar o throughput), adicionando mais instâncias de réplicas ao cluster.

Você pode escalar os recursos computacionais alocados para uma instância no Console de Gerenciamento da AWS selecionando a instância desejada e clicando no botão Modify. Os recursos de memória e de CPU são modificados alterando a classe da instância.

Ao modificar a classe de instância, as alterações solicitadas serão aplicadas durante sua janela de manutenção especificada. Como alternativa, você pode usar o marcador “Aplicar imediatamente” para aplicar suas solicitações de escalabilidade imediatamente. As duas opções afetarão a disponibilidade por alguns minutos enquanto a operação de escalabilidade é realizada. Lembre-se de que qualquer outra alteração pendente do sistema também será aplicada.

Backup e restauração

Abrir tudo

Os backups automáticos estão sempre habilitados nos clusters do HAQM DocumentDB. O recurso de backup de banco de dados simples do HAQM DocumentDB permite a recuperação em um ponto anterior no tempo de seus clusters. Você pode aumentar a janela de backup para restaurações em um ponto anterior no tempo para até 35 dias. Os backups não afetam a performance do banco de dados.

Sim. Os snapshots manuais podem ser mantidos além da janela de backup e a criação de snapshots não afeta a performance. Observe que restaurar dados a partir de snapshots do cluster exige a criação de um novo cluster.

O HAQM DocumentDB torna automaticamente seus dados duráveis em três zonas de disponibilidade (AZs) de uma região e tentará recuperar, de forma automática, a instância em uma AZ íntegra, sem perda de dados. No caso improvável dos dados estarem indisponíveis no armazenamento do HAQM DocumentDB, você pode restaurar com base em um snapshot do cluster ou realizar uma operação de restauração para um ponto no tempo para um novo cluster. Observe que o último momento restaurável para uma operação de restauração em um ponto anterior no tempo pode ser de até cinco minutos atrás.

Você pode optar por criar um snapshot final ao excluir a instância. Se fizer isso, você poderá usar esse snapshot para restaurar a instância excluída posteriormente. Após a exclusão da instância, o HAQM DocumentDB reterá esse snapshot criado pelo usuário, junto de todos os outros snapshots criados manualmente. Apenas os snapshots são mantidos depois da exclusão da instância (ou seja, os backups automáticos criados para restauração pontual não são mantidos).

A exclusão da sua conta da AWS excluirá todos os backups e snapshots automatizados contidos na conta.

Sim. O HAQM DocumentDB permite criar snapshots de cluster que podem ser usados posteriormente para restaurar um cluster. Você pode compartilhar um snapshot com uma conta diferente da AWS e o proprietário da conta de destino pode usar esse snapshot para restaurar um cluster com os seus dados. Você pode até mesmo optar por tornar seus snapshots públicos, ou seja, qualquer pessoa pode restaurar um cluster contendo seus dados (públicos). É possível usar este recurso para compartilhar dados entre seus vários ambientes (produção, desenvolvimento/teste, preparação, etc.) que tenham contas diferentes da AWS, como também manter backups de todos os seus dados seguros em uma conta separada, caso sua conta principal da AWS sofra uma ameaça em algum momento.

Não há cobrança pelo compartilhamento de snapshots entre contas. No entanto, podem haver cobranças pelos snapshots em si, como também por qualquer cluster que você restaurar usando os snapshots compartilhados.

Não oferecemos suporte ao compartilhamento de snapshots de cluster automáticos. Para compartilhar um snapshot automático, você deve criar manualmente uma cópia do snapshot e, então, compartilhar a cópia.

Não. Os snapshots compartilhados do HAQM DocumentDB só poderão ser acessados por contas na mesma região da conta que os compartilha.

Sim. Você pode compartilhar snapshots criptografados do HAQM DocumentDB. O destinatário do snapshot compartilhado deve ter acesso à chave do KMS usada para criptografar o snapshot.

Não. Os snapshots do HAQM DocumentDB só podem ser usados dentro do serviço.

Você pode optar por criar um snapshot final ao excluir o cluster. Se fizer isso, você poderá usar esse snapshot para restaurar posteriormente o cluster excluído. Após a exclusão do cluster, o HAQM DocumentDB reterá esse snapshot criado pelo usuário, juntamente com todos os outros snapshots criados manualmente.

Alta disponibilidade e replicação

Abrir tudo

O HAQM DocumentDB divide automaticamente o volume do armazenamento em segmentos de 10 GB em vários discos. Cada bloco de 10 GB do volume de armazenamento é replicado seis vezes em três zonas de disponibilidade (AZs). O HAQM DocumentDB é projetado para tratar de maneira transparente a perda de até duas cópias de dados sem afetar a disponibilidade de gravação e até três cópias sem afetar a disponibilidade de leitura. Além disso, o volume de armazenamento do HAQM DocumentDB também oferece recuperação automática. Os blocos e discos de dados são varridos continuamente em busca de erros e corrigidos automaticamente.

Ao contrário de outros bancos de dados, depois de uma falha, o HAQM DocumentDB não precisa reproduzir o log de repetição do último ponto de verificação do banco de dados (normalmente cinco minutos) e confirmar que todas as alterações foram aplicadas antes de disponibilizar o banco de dados para operações. Isso reduz os tempos de reinicialização do banco de dados para menos de 60 segundos na maioria dos casos. O HAQM DocumentDB move o cache para fora do processo do banco de dados e o disponibiliza imediatamente no momento da reinicialização. Isso evita que você tenha que controlar o acesso até que o cache esteja preenchido novamente para evitar comprometimentos de performance.

O HAQM DocumentDB oferece suporte a réplicas de leitura, que compartilham o mesmo volume de armazenamento subjacente da instância principal. As atualizações feitas pela instância principal são visíveis para todas as réplicas do HAQM DocumentDB.

  • Recurso: réplicas de leitura do HAQM DocumentDB
  • Número de réplicas: até 15
  • Tipo de replicação: assíncrona (normalmente, milissegundos)
  • Impacto de performance na instância principal: baixo
  • Atua como destino de failover: sim (sem perda de dados)
  • Failover automatizado: sim

Sim, você pode replicar seus dados entre regiões usando o recurso Global Cluster. Os Global Clusters se estendem entre várias Regiões da AWS. Os Global Clusters replicam seus dados para clusters em até cinco regiões com pouco ou nenhum impacto na performance. Os Global Clusters oferecem recuperação de desastres mais rápida após interrupções por toda a região e permitem leituras globais de baixa latência. Para saber mais, consulte nossa publicação no blog.

Sim. Você pode atribuir um nível de prioridade de promoção a cada instância no seu cluster. Se a instância principal falhar, o HAQM DocumentDB promoverá a réplica com a maior prioridade como principal. Se houver inconsistências entre duas ou mais réplicas na mesma camada de prioridade, o HAQM DocumentDB promoverá a réplica que tiver o mesmo tamanho da instância principal.

É possível modificar a camada de prioridade para uma instância a qualquer momento. Um failover não é acionado apenas com a modificação de camadas de prioridade.

Você pode atribuir níveis de prioridade mais baixos para réplicas que não quer promover para a instância principal. No entanto, se as réplicas de prioridade mais alta no cluster não estiverem íntegras ou disponíveis por alguma razão, o HAQM DocumentDB promoverá a réplica de prioridade mais baixa.

O HAQM DocumentDB pode ser implantado em uma configuração de alta disponibilidade, usando instâncias de réplica em várias zonas de disponibilidade da AWS como destinos de failover. No caso de uma falha de instância principal, a instância replicada é promovida automaticamente como a nova principal, com o mínimo de interrupção do serviço.

Você pode acrescentar réplicas do HAQM DocumentDB. As réplicas do HAQM DocumentDB compartilham o mesmo armazenamento subjacente da instância principal. Qualquer réplica do HAQM DocumentDB pode ser promovida para tornar-se principal sem nenhuma perda de dados e, portanto, pode ser usada para melhorar a tolerância a falhas no caso de falha de uma instância principal. Para aumentar a disponibilidade do cluster, crie de 1 a 15 réplicas em várias AZs. O HAQM DocumentDB as incluirá automaticamente na escolha de principal pelo failover no caso de interrupção da instância.

O failover é controlado automaticamente pelo HAQM DocumentDB para que as aplicações possam retomar as operações de banco de dados com a maior rapidez possível sem intervenção administrativa manual.

  • Se você tiver uma instância de réplica do HAQM DocumentDB na mesma zona de disponibilidade ou em outra, ao fazer o failover, o HAQM DocumentDB alterará o registro de nome canônico (CNAME) do da instância para apontar para a réplica íntegra, que, por sua vez, será promovida como a nova principal. Normalmente, o failover é concluído em até 30 segundos. 
  • Se você não tiver uma instância de réplica do HAQM DocumentDB (ou seja, um cluster de uma única instância), o HAQM DocumentDB tentará criar uma nova instância na mesma zona de disponibilidade da instância original. Faremos o possível para substituir a instância original, mas pode ser que isso não tenhamos sucesso se, por exemplo, ocorrer um problema que afete amplamente a zona de disponibilidade. 

Seu aplicativo deve tentar novamente fazer as conexões do banco de dados em caso de perda de conexão.

O HAQM DocumentDB detectará automaticamente um problema com a instância principal e começará a rotear o tráfego de leitura/gravação para uma instância de réplica do HAQM DocumentDB. Em média, o failover é concluído em até 30 segundos. Além disso, o tráfego de leitura atendido pelas instâncias de réplica do HAQM DocumentDB será brevemente interrompido.

Como as réplicas do HAQM DocumentDB compartilham o mesmo volume de dados da instância principal, praticamente não há atraso na replicação. Normalmente, observamos defasagens de dezenas de milissegundos.

Segurança e conformidade

Abrir tudo

Sim. Todos os clusters do HAQM DocumentDB devem ser criados em uma VPC. Com o HAQM VPC, é possível definir uma topologia de rede virtual que lembra muito uma rede tradicional que você poderá operar no seu próprio Datacenter. Isso oferece a você total controle sobre quem acessa seus clusters do HAQM DocumentDB.

O HAQM DocumentDB aceita o RBAC com funções integradas. O RBAC permite que você aplique o menor privilégio como uma prática recomendada ao restringir as ações que os usuários estão autorizados a executar. Para obter mais informações, consulte o controle de acesso com base na função do HAQM DocumentDB.

O HAQM DocumentDB utiliza os perímetros rigorosos de rede e autorização da VPC. A autenticação e a autorização para as APIs de gerenciamento do HAQM DocumentDB são fornecidas por perfis, políticas e usuários do IAM. A autenticação em um banco de dados do HAQM DocumentDB é feita por meio de ferramentas e drivers padrão do MongoDB com o Salted Challenge Response Authentication Mechanism (SCRAM), o mecanismo de autenticação padrão do MongoDB.

Sim. O HAQM DocumentDB permite criptografar clusters usando chaves gerenciadas por meio do AWS Key Management Service (KMS). Em um cluster em execução com a criptografia do HAQM DocumentDB, os dados ociosos mantidos no armazenamento subjacente são criptografados, bem como os backups automáticos, as réplicas de leitura e os snapshots desses dados no mesmo cluster. A criptografia e a descriptografia são processadas de forma transparente. Para obter mais informações sobre o uso do KMS com o HAQM DocumentDB, consulte Criptografar dados do HAQM DocumentDB em repouso.

No momento, não há suporte à criptografia de um cluster do HAQM DocumentDB existente não criptografado. Para usar a criptografia do HAQM DocumentDB para um cluster existente não criptografado, crie um novo cluster com criptografia habilitada e migre os dados para ele.

O HAQM DocumentDB foi projetado para atender aos mais altos padrões de segurança, facilitar a sua verificação de nossa segurança e cumprir suas próprias obrigações normativas e de conformidade. O HAQM DocumentDB foi avaliado como estando e conformidade com a PCI DSS, ISO 9001 , 27001 , 27017 e 27018, SOC 1, 2 e 3 e a certificação de Estrutura comum de segurança (CSF) da Health Information Trust Alliance (HITRUST), além de estar qualificado para a HIPAA. Os relatórios de conformidade da AWS estão disponíveis para download no AWS Artifact.

Importante atualização da versão

Abrir tudo

A major version upgrade (MVU – atualização de versão principal) no local permite que você atualize clusters do HAQM DocumentDB 3.6 ou 4.0 para o HAQM DocumentDB 5.0 usando o console da AWS, o kit de desenvolvimento de software (SDK) ou a interface de linha de comando (CLI). Com a MVU no local, não há necessidade de criar novos clusters ou alterar seus endpoints. A MVU no local está disponível em todas as regiões em que o HAQM DocumentDB 5.0 está disponível. Para começar a usar a MVU no local, consulte a documentação sobre a MVU no local.

A MVU no local permite que você atualize facilmente seus clusters do HAQM DocumentDB 3.6 ou 4.0 para a versão 5.0 sem precisar fazer backup e restauração em outro cluster e sem usar outras ferramentas de migração de dados. Essa abordagem reduz o tempo e o esforço associados ao processo de atualização normal, que envolve a configuração dos endpoints de origem e destino, a migração de índices e dados, a alteração do código da aplicação e muito mais.

Você não precisará alterar seu endpoint nas aplicações após a atualização. Como os dados permanecem no mesmo cluster, não há custo adicional para atualizar usando este recurso.

O tempo de inatividade pode variar de cluster para cluster, dependendo do número de coleções, índices, bancos de dados e instâncias. Antes de executar a atualização de versão principal no local no cluster de produção, é altamente recomendável executá-la em um ambiente inferior para testar o tempo de inatividade, a performance e verificar se as aplicações funcionam conforme o esperado após a atualização.

Você também pode utilizar o recurso de clonagem rápida do HAQM DocumentDB para clonar seus dados de cluster para testes. Dependendo da complexidade da implementação do HAQM DocumentDB, você pode solicitar ajuda adicional do nosso arquiteto de soluções de banco de dados.

A MVU no local só é compatível com o HAQM DocumentDB 3.6 ou 4.0 como origem e com a versão 5.0 como destino. Não é compatível com HAQM DocumentDB Global Clusters ou Elastic Clusters ou com o DocumentDB 4.0 como destino.

Machine learning

Abrir tudo

O HAQM DocumentDB se integra ao HAQM SageMaker Canvas, facilitando a criação de modelos de machine learning (ML) e a personalização de modelos básicos usando dados armazenados no HAQM DocumentDB sem escrever uma única linha de código. Você não precisa mais desenvolver dados personalizados e pipelines de ML entre o HAQM DocumentDB e o SageMaker Canvas. Você pode iniciar o SageMaker Canvas no console do HAQM DocumentDB e adicionar bancos de dados HAQM DocumentDB existentes como fonte de dados para começar a criar seus modelos de machine learning. Você pode usar seus dados no DocumentDB no SageMaker Canvas e criar modelos para prever a rotatividade de clientes, detectar fraudes, prever falhas de manutenção, prever métricas financeiras e vendas, otimizar inventário, resumir conteúdo e gerar conteúdo.

IA generativa e machine learning

Abrir tudo

O HAQM SageMaker Canvas oferece uma interface sem código para criar modelos de machine learning usando dados de várias fontes de dados, incluindo o HAQM DocumentDB. Você é cobrado pelo uso do SageMaker Canvas e pelas E/S resultantes quando o SageMaker Canvas ler os dados da instância do HAQM DocumentDB. Não há custo adicional para usar o DocumentDB como fonte de dados no HAQM SageMaker Canvas. Consulte a página de preços do HAQM DocumentDB e a página de preços do SageMaker Canvas para saber mais.

A pesquisa vetorial para o HAQM DocumentDB combina a flexibilidade e a rica capacidade de consulta de um banco de dados de documentos baseado em JSON com o poder da pesquisa vetorial. Você pode usar seus dados existentes do HAQM DocumentDB, ou uma estrutura de dados de documentos flexível, para criar casos de uso de machine learning e IA generativa, como experiências de pesquisa semântica, recomendações de produtos, personalização, chatbots, detecção de fraudes e detecção de anomalias. Consulte a documentação sobre pesquisa vetorial do HAQM DocumentDB para saber mais.

A pesquisa vetorial para o HAQM DocumentDB permite o uso da pesquisa semântica para que você possa capturar o significado, o contexto e a intenção por trás de seus dados. A pesquisa por palavra-chave localiza o documento com base no texto real ou em mapeamentos de sinônimos predefinidos. Por exemplo, em um aplicativo de comércio eletrônico tradicional, um vestido vermelho pode devolver produtos que tenham as palavras “vermelho” e “vestido” em suas descrições. A pesquisa semântica recuperará resultados com vestidos em diferentes tons de vermelho, o que pode melhorar a experiência do usuário.  

Não há custo adicional para usar a pesquisa vetorial no HAQM DocumentDB. As taxas padrão de computação, E/S, armazenamento e backup serão aplicadas à medida que você armazenar, indexar e pesquisar vetores no HAQM DocumentDB. Consulte a página de preços do HAQM DocumentDB para saber mais.

O HAQM DocumentDB se integra ao HAQM SageMaker Canvas, facilitando a criação de aplicações de inteligência artificial (IA) generativa e machine learning (ML) usando dados armazenados no HAQM DocumentDB. Você não precisa mais desenvolver dados personalizados e pipelines de ML entre o HAQM DocumentDB e o SageMaker Canvas. A integração no console elimina o trabalho pesado indiferenciado de conectar e acessar dados para acelerar o desenvolvimento de ML com uma experiência de baixo código sem código (LCNC). Você pode iniciar o SageMaker Canvas no console do HAQM DocumentDB e adicionar bancos de dados HAQM DocumentDB existentes como fonte de dados.

Integração ETL zero

Abrir tudo

Essa Integração ETL zero com o HAQM OpenSearch Service abstrai a complexidade operacional no processo de extração, transformação e carregamento de dados de uma coleção do HAQM DocumentDB para um cluster gerenciado ou uma coleção sem servidor do HAQM OpenSearch. Com essa integração, você não precisa mais criar ou gerenciar pipelines de dados nem transformar dados.

Se quiser usar as APIs do MongoDB, você deve usar os recursos nativos do banco de dados no HAQM DocumentDB para realizar pesquisas vetoriais nos seus documentos. A integração do HAQM DocumentDB ETL zero com o HAQM OpenSearch Service é adequada para pesquisar em coleções e armazenar e indexar vetores com mais de 2.000 dimensões.

A Integração ETL zero do HAQM DocumentDB com o HAQM OpenSearch Service usa o HAQM OpenSearch Ingestion para mover facilmente dados operacionais do HAQM DocumentDB para o HAQM OpenSearch Service. Para começar, você habilita a funcionalidade de fluxo de alterações na coleção do HAQM DocumentDB que precisa ser replicada. O recurso de Integração ETL zero configura um pipeline de ingestão do HAQM OpenSearch na sua conta que replica automaticamente os dados em um cluster gerenciado do HAQM OpenSearch Service ou em uma coleção sem servidor.

O HAQM OpenSearch Ingestion compreende automaticamente o formato dos dados nas coleções do HAQM DocumentDB e mapeia os dados para o HAQM OpenSearch Service com a finalidade de gerar os melhores resultados de pesquisa. Você pode sincronizar dados de várias coleções do HAQM DocumentDB por meio de vários pipelines em um cluster gerenciado pelo HAQM OpenSearch ou em uma coleção sem servidor para oferecer insights holísticos em várias aplicações. Opcionalmente, você pode especificar processadores de dados personalizados ao definir a configuração de ingestão no HAQM OpenSearch Service. As atualizações subsequentes das coleções do DocumentDB também são replicadas para o HAQM OpenSearch Service sem qualquer intervenção manual.

A Integração ETL zero usa os recursos nativos de transformação de dados dos pipelines do HAQM OpenSearch Ingestion para agregar e filtrar os dados enquanto eles estão em movimento.

Você também pode escrever uma lógica de transformação personalizada se quiser capacidade de transformação personalizada, e o HAQM OpenSearch Ingestion gerenciará o processo de transformação. Como alternativa, se você quiser mover dados inteiros da origem para o coletor sem personalização, o HAQM OpenSearch Ingestion fornece esquemas prontos para que você possa realizar as integrações com apenas alguns cliques.

Para garantir que o HAQM OpenSearch Ingestion tenha as permissões necessárias para replicar dados do HAQM DocumentDB, o recurso de Integração ETL zero cria um perfil do IAM com as permissões necessárias para ler dados das tabelas do HAQM DocumentDB e gravar em um domínio ou coleção do HAQM OpenSearch. Esse perfil é então assumido por pipelines do HAQM OpenSearch Ingestion para garantir que a postura de segurança correta seja sempre mantida ao mover os dados da origem para o destino.

Você pode visualizar todas as métricas relacionadas à sua Integração ETL zero com o HAQM DocumentDB nos painéis do console fornecidos pelo HAQM DocumentDB e pelo pipeline do OpenSearch Ingestion. Também pode consultar logs em tempo real no HAQM CloudWatch e configurar alertas personalizados usando o HAQM CloudWatch, que são acionados quando limites definidos pelo usuário são violados.