Veröffentlicht am: Apr 28, 2021

Die native Unterstützung von JSON und halb-strukturierten Daten durch HAQM Redshift steht jetzt allgemein zur Verfügung. Es basiert auf dem neuen Datentyp „SUPER“, mit dem Sie halb-strukturierte Daten in Ihre HAQM Redshift Data Warehouses aufnehmen und speichern können. HAQM Redshift unterstützt außerdem PartiQL für einen SQL-kompatiblen Zugriff auf relationale, halb-strukturierte und verschachtelte Daten. Mit dem Datentyp SUPER und PartiQL in HAQM Redshift können Sie erweiterte Analysen durchführen, die klassischen strukturierten SQL-Daten (z. B. Zeichenfolgen, Zahlen und Zeitstempel) mit den halb-strukturierten SUPER-Daten (z. B. JSON) mit überlegener Leistung, Flexibilität und Benutzerfreundlichkeit kombinieren.

Der Datentyp SUPER ist schematischer Natur und ermöglicht die Speicherung verschachtelter Werte, die aus Redshift-Skalarwerten, verschachtelten Arrays oder anderen verschachtelten Strukturen bestehen können. HAQM Redshift unterstützt das Parsen von JSON-Daten in SUPER und das bis zu 5-mal schnellere Einfügen von JSON / SUPER-Daten im Vergleich zum Einfügen ähnlicher Daten in klassische skalare Spalten. PartiQL ist eine Erweiterung von SQL, die für mehrere AWS-Services verwendet wird. PartiQL ermöglicht den Zugriff auf schemenlose und verschachtelte SUPER-Daten über eine effiziente Objekt- und Array-Navigation, das Nicht-Verschachteln und das flexible Erstellen von Abfragen mit klassischen Analyse Operationen wie JOINs und Aggregaten. Dies ermöglicht neue erweiterte Analysen, bei denen Kombinationen aus strukturierten und halb-strukturierten Daten ermittelt werden. Dateningenieure können eine vereinfachte ELT-Verarbeitung (Extrahieren, Laden, Transformieren) mit geringer Latenz der eingefügten halb-strukturierten Daten direkt in ihrem Redshift-Cluster erreichen, ohne sie in externe Dienste zu integrieren. Zu den PartiQL-Funktionen, die ELT ermöglichen, gehören neben der Navigation und der Unnesting auch die schemenlose Semantik, die dynamische Typisierung und Typ-Prüfungsfunktionen. Dadurch wird das Einlesen und Abfragen von schemalosen Daten viel einfacher, da die Benutzer nicht mehr die Datentypen für jede eingelesene Quelle vorab ermitteln, mit sich entwickelnden Schemata umgehen oder komplexes SQL schreiben müssen, um bei der Abfrage der Daten verschiedene Typen zu berücksichtigen. Benutzer können die halb-strukturierten Daten einfach vernichten, indem Sie materialisierte Ansichten erstellen, und um Größenordnungen schnellere analytische Abfragen erzielen, während die materialisierten Ansichten automatisch und schrittweise beibehalten werden.

Die native Unterstützung für JSON und halb-strukturierte Daten in HAQM Redshift ist in allen kommerziellen Regionen verfügbar

Weitere Informationen zur nativen Unterstützung von JSON und halb-strukturierten Daten in HAQM Redshift finden Sie in der Dokumentation.