Presto sur HAQM EMR
Fonctionnalités et avantages
Réussite client
Témoignages de réussite de Netflix
Netflix a choisi Presto comme moteur de requêtes interactif compatible ANSI SQL pour le Big Data. Presto est correctement dimensionné et open source, et s'intègre à Hive Metastore et HAQM S3, la dorsale de l'environnement d'entrepôt Big Data de Netflix. Netflix exécute Presto sur des clusters HAQM EMR permanents pour interroger rapidement et avec souplesse les données stockées dans son magasin de données HAQM S3 d'une capacité d'environ 25 Po. Netflix est un contributeur actif de Presto, et HAQM EMR donne à Netflix la possibilité d'exécuter sa propre version de Presto sur des clusters HAQM EMR. En moyenne, Netflix exécute environ 3 500 requêtes par jour sur ses clusters Presto.

Témoignages de réussite de Jammp
Jampp est une plateforme de marketing pour applications mobiles qui utilise des techniques avancées de reciblage publicitaire pour encourager les utilisateurs engagés à utiliser des applications. Pour ce faire, Jampp achète un inventaire mobile via son propre moteur d'enchères en temps réel basé sur la conversion, qui enchérit de façon dynamique sur l'inventaire sur 18 échanges d'enchères en temps réel et plus de 150 réseaux publicitaires mobiles. Jampp utilise Presto sur HAQM EMR pour l'analyse ad hoc avancée de journaux, en associant des données provenant de plusieurs sources et des calculs de segment de reciblage complexes. La base d'utilisateurs de Jampp a augmenté de 600 %, tout comme la demande de requêtes analytiques complexes. L'entreprise a abandonné son application Python multicœur complexe exécutée sur MySQL au profit de Presto, ce qui a multiplié par douze ses performances. Jampp utilise actuellement Presto sur HAQM EMR pour traiter 40 To de données par jour.

Témoignages de réussite de Cogo Labs
Incubateur de start-up, Cogo Labs exploite une plateforme d'analyse marketing et d'informatique décisionnelle utilisée par ses sociétés de portefeuille et ses équipes internes. Pour prendre en charge un environnement OLAP caractérisé par un fort taux d'innovation, l'entreprise s'est conformée à la norme SQL pour assurer l'interaction avec les données. Cogo Labs a choisi Presto pour ses performances de requêtes en temps réel, sa prise en charge de la norme ANSI SQL et sa capacité à traiter les données directement depuis HAQM S3. Lorsqu'il est exécuté sur HAQM EMR, le moteur Presto permet à plus de 100 développeurs et analystes d'exécuter des requêtes SQL sur plus de 500 To de données stockées sur HAQM S3 pour l'exploration de données, l'analyse ad hoc et la génération de rapports. Cogo Labs utilise une combinaison de clusters à courte durée de vie et permanents, et s'appuie sur l'intégration d'HAQM EMR aux instances Spot pour réduire ses coûts.

Témoignages de réussite d’OpenSpan
OpenSpan propose des solutions d'automatisation et d'informatique décisionnelle qui aident à relier les personnes, les processus et la technologie pour avoir un aperçu de la productivité des employés, simplifier les transactions et impliquer les employés et les clients. OpenSpan a migré depuis HBase vers Presto sur HAQM EMR et stocke ses données dans HAQM S3. OpenSpan a choisi Presto en raison de son interface SQL et de sa capacité à interroger les données en temps réel directement depuis HAQM S3 ; le moteur permet à l'entreprise d'explorer rapidement de grandes quantités de données et d'itérer rapidement les prochains produits de données. OpenSpan utilise le format de fichier Parquet et fait appel à PrestogreSQL pour se connecter à Presto. OpenSpan a choisi HAQM EMR et HAQM S3 pour traiter de façon rentable les gigaoctets de données transmis chaque jour par ses clients.

Témoignages de réussite de Kanmu
Kanmu est une start-up japonaise opérant dans le secteur des services financiers. Elle propose à ses clients des offres qui dépendent de l'utilisation de leur carte de crédit. Kanmu a migré de Hive vers Presto sur HAQM EMR en raison de la capacité de Presto à exécuter des analyses exploratoires et itératives à une vitesse interactive, de ses bonnes performances avec HAQM S3 et de son évolutivité permettant d'interroger de grands ensembles de données. Kanmu utilise Fluentd-plugin-s3 pour transférer des données vers HAQM S3, le format en colonnes en lignes optimisé (ORC) pour stocker des données et utilise shib, un client Web basé sur node.js, pour exécuter des requêtes SQL.
