Publié le: Apr 13, 2023

Aujourd'hui, HAQM Redshift a introduit des améliorations de performances supplémentaires qui accélèrent le traitement des données basé sur des chaînes de 5 à 63 fois par rapport aux codages de compression alternatifs tels que LZO ou ZSTD. HAQM Redshift y parvient grâce à des scans vectorisés sur des colonnes de chaîne légères codées dans un dictionnaire et économes en ressources processeur, qui permettent au moteur de base de données de fonctionner directement sur les données compressées. Ces techniques sont optimales sur les colonnes de chaînes de faible cardinalité (CHAR ou VARCHAR). Les colonnes de chaînes à faible cardinalité sont des colonnes qui contiennent jusqu'à quelques centaines de valeurs de chaîne uniques.

Vous pouvez automatiquement bénéficier de cette nouvelle amélioration des performances élevées en activant l'optimisation automatique des tables (ATO) dans votre entrepôt des données HAQM Redshift. Si l'ATO n'est pas activé sur vos tables, vous pouvez recevoir des recommandations d'HAQM Redshift Advisor sur la console HAQM Redshift concernant l'adéquation d'une colonne de chaîne au codage BYTEDICT. Vous pouvez également définir de nouvelles tables comportant des colonnes de chaînes de faible cardinalité avec le codage BYTEDICT. Les améliorations apportées aux chaînes dans HAQM Redshift sont désormais disponibles dans toutes les régions HAQM Web Services (AWS) où HAQM Redshift est disponible.