
Careem migliora la prevenzione delle frodi grazie ad AWS Machine Learning
2021
Careem, con sede a Dubai, è diventata la prima azienda unicorno del Medio Oriente quando è stata acquisita da Uber per 3,1 miliardi di dollari nel 2019. Pioniera dell'economia del ride-hailing nella regione, Careem sta espandendo i suoi servizi per includere il trasporto di massa, le consegne e i pagamenti come super app quotidiana.
Ma le sue dimensioni e la sua popolarità, con circa 50 milioni di account clienti, l'hanno resa anche un ottimo bersaglio per i truffatori che cercano costantemente nuovi escamotage da sfruttare e modi diversi per dirottare account autentici.
Careem aveva bisogno di un modo per rilevare e fermare le perdite dovute a frodi che stavano danneggiando sia il fatturato che la reputazione del brand.
Si è rivolta ad HAQM Web Services (AWS) e ora sta contrastando il fenomeno utilizzando l'analisi e il machine learning per identificare e bloccare automaticamente i truffatori prima che venga commesso qualsiasi reato.


HAQM Neptune è completamente gestito, il che è un grande vantaggio per noi in termini di personale da impiegare in questo progetto e di costi potenziali di infrastruttura e manutenzione."
Kevin O'Brien
Data scientist senior presso Careem
Quando i truffatori attaccano
Careem rileva un'ampia varietà di frodi e i criminali trovano sempre nuove scappatoie per aggirare le misure specifiche messe in atto per contrastare i modelli di frode esistenti rilevati.
In passato, affrontare questi diversi tipi di frode era come giocare al gatto e topo. Careem doveva creare regole o modelli di machine learning per ogni tipo specifico di frode. Ma ciò presentava due problemi.
In primo luogo, permetteva a Careem di identificare e bloccare un account solo dopo che la frode era stata commessa e rilevata: ma a quel punto i soldi erano già andati persi.
In secondo luogo, i truffatori erano in grado di individuare rapidamente quando Careem aveva scoperto come rilevare quel tipo di frode e andavano avanti, trovando una nuova falla.
Un modo più intelligente
Era chiaro che Careem aveva bisogno di un modo più intelligente e veloce per rilevare gli account fraudolenti e fermare le frodi prima che fossero commesse.
"Invece di creare continuamente strumenti molto specifici per rilevare casi d'uso di frode molto specifici, volevamo creare un progetto che fosse quasi un meccanismo di rilevamento generalizzato per tutti gli utenti, indipendentemente dal tipo di falla trovata o dal tipo di attacco tentato", afferma Kevin O'Brien, senior data scientist di Careem.
Careem ha optato per un database a grafo per rilevare modelli potenzialmente fraudolenti in tempo reale attraverso l'attività degli utenti e degli account e ha valutato diversi dei principali fornitori sul mercato.
Ha scelto AWS e le funzionalità automatizzate di analisi e monitoraggio in tempo reale di HAQM Neptune, in parte perché è un servizio gestito.
"HAQM Neptune è completamente gestito, il che è un grande vantaggio per noi in termini di personale da impiegare in questo progetto e di costi potenziali di infrastruttura e manutenzione", dice O'Brien. "Invece, è tutto completamente gestito da AWS."
Careem utilizzava già AWS per tutte le sue operazioni di cloud computing e data warehouse, quindi ha deciso di rimanere nello stesso ambiente per il suo progetto di prevenzione delle frodi.
Careem preferiva anche il linguaggio di interrogazione Gremlin che supporta HAQM Neptune rispetto ai linguaggi di query come Cypher utilizzati da altri provider di database a grafo. Gremlin consente agli sviluppatori di scrivere query in una serie di linguaggi di programmazione, tra cui Groovy, Java e Python.
Rilevamento dei modelli concentrandosi sull'identità
Per migliorare la sua capacità di rilevamento delle frodi utilizzando HAQM Neptune, Careem ha iniziato a concentrarsi sull'identità degli utenti oltre a impegnarsi per affrontare tipi specifici di frode man mano che si presentavano.
Il database a grafo HAQM Neptune consente a Careem di stabilire connessioni tra diversi utenti e punti dati e di identificare modelli che potrebbero indicare attività fraudolente.
La prima versione del progetto di prevenzione delle frodi è stata lanciata nell'ottobre 2020 utilizzando i dati storici degli utenti risalenti al 2012 provenienti da fonti interne di Careem, come il suo data warehouse. Questi dati vengono estratti, trasformati e quindi formattati in file CSV su HAQM Simple Storage Service (HAQM S3) prima di essere caricati su HAQM Neptune. Questi dati storici vengono aggiunti in tempo reale man mano che gli utenti eseguono nuove azioni, come l'accesso da un nuovo dispositivo, l'aggiunta di una nuova carta di credito, il cambio numero di telefono o apportare una modifica al profilo. In media, i dati vengono aggiunti o aggiornati nel grafo di HAQM Neptune più di 100.000 volte al giorno.
Questo crea un cluster di dati collegati a ciascun utente, che vengono analizzati utilizzando un semplice motore di analisi algoritmico, creato da Careem utilizzando Python, che si trova su HAQM Neptune.
Quando un account viene segnalato come potenzialmente fraudolento, viene bloccato automaticamente se dai dati risulta che si tratta di un account storicamente non affidabile o segnalato per una revisione manuale se si tratta di un account affidabile o ad alto valore, come quello di un cliente aziendale.
Ridurre le perdite con una maggiore precisione
Careem ha bloccato decine di migliaia di account utente fraudolenti dall'implementazione della prima fase del progetto nell'ottobre 2020 e i risultati sono impressionanti: circa il 90% degli utenti bloccati automaticamente dal sistema era stato bloccato correttamente. Ciò significa che Careem sta bloccando questi account falsi prima che venga commessa qualsiasi frode, il che aiuta a ridurre le perdite.
Dopo il successo di questa prima fase del progetto, Careem sta ora collaborando con AWS per una versione aggiornata che migliorerà ulteriormente l'accuratezza utilizzando la funzionalità di machine learning di HAQM Neptune ML.
Utilizzando circa 10 volte più dati storici, Careem sarà in grado di applicare il deep learning avanzato anziché un approccio basato su semplici regole e addestrare il sistema in modo che possa imparare a identificare come appare un utente fraudolento sul database a grafo. Ciò consentirà un recupero notevolmente migliore, dove il sistema sarà in grado di rilevare correttamente più account fraudolenti tra tutti gli utenti analizzati, migliorando al contempo l'accuratezza della previsione delle frodi ben oltre il 90%.
"Siamo molto fiduciosi che questa seconda versione della nostra soluzione migliorerà le nostre attuali capacità di prevenzione delle frodi", afferma O'Brien. "E questo è un altro ottimo motivo per cui abbiamo scelto HAQM Neptune."
Informazioni su Careem
Careem, con sede a Dubai, è pioniera dell'economia del ride-hailing e ora sta espandendo i suoi servizi per includere il trasporto di massa, le consegne e i pagamenti. Fondata nel 2012, Careem opera in oltre 100 città in 14 paesi del Medio Oriente, dell'Africa e dell'Asia meridionale. È stata acquisita da Uber per 3,1 miliardi di dollari nel 2019.
Vantaggi di AWS
- Sicurezza e conformità
- Agilità e prestazioni
- Disponibilità
- Innovazione
Servizi AWS utilizzati
HAQM Neptune
HAQM Neptune è il servizio di database a grafo rapido, affidabile e completamente gestito che semplifica la creazione e l'esecuzione di applicazioni che funzionano con set di dati altamente connessi.
HAQM Redshift
Con Redshift è possibile eseguire query e combinare esabyte di dati strutturati e semi-strutturati nel data warehouse, database operativo e data lake utilizzando SQL standard.
HAQM S3
HAQM Simple Storage Service (HAQM S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.
HAQM SageMaker
HAQM SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML.
Inizia subito
Ulteriori informazioni su HAQM Neptune. Un database a grafo veloce e affidabile progettato per il cloud.