Publicado: Apr 13, 2023

Hoje, o HAQM Redshift introduziu aprimoramentos adicionais de performance que aceleram o processamento de dados baseado em strings de 5 a 63 vezes em comparação com codificações de compressão alternativas como LZO ou ZSTD. O HAQM Redshift consegue isso por meio de escaneamentos vetorizados em colunas de string leves, codificadas por dicionário e com uso eficiente de CPU. Esses recursos permitem que o mecanismo de banco de dados opere diretamente sobre dados compactados. Essas técnicas são ideais em colunas de strings de baixa cardinalidade (CHAR ou VARCHAR). As colunas de strings de baixa cardinalidade têm até algumas centenas de valores únicos de strings.

Você pode se beneficiar automaticamente desse novo aprimoramento de strings de alta performance ativando a otimização automática de tabelas (ATO) em data warehouses do HAQM Redshift. Se a ATO não estiver ativada nas tabelas, você poderá receber recomendações do HAQM Redshift Advisor no console do HAQM Redshift sobre a adequação de uma coluna de strings para a codificação BYTEDICT. Você também pode definir novas tabelas com colunas de strings de baixa cardinalidade com a codificação BYTEDICT. Agora, os aprimoramentos de strings no HAQM Redshift estão disponíveis em todas as regiões da HAQM Web Services (AWS) em que o HAQM Redshift é oferecido.