Careem melhora prevenção de fraudes com machine learning da AWS
2021
A Careem, com sede em Dubai, tornou-se o primeiro unicórnio do Oriente Médio quando foi adquirida pela Uber por USD 3,1 bilhões em 2019. Pioneira no mercado de caronas compartilhadas da região, a Careem agora está expandindo seus serviços para incluir transporte em massa, entregas e pagamentos como um superaplicativo para uso diário.
Porém, seu tamanho e popularidade (ela tem cerca de 50 milhões de contas de clientes) também a tornaram o principal alvo de fraudadores que estão constantemente à procura de novas brechas para explorações e de diferentes maneiras de sequestrar contas genuínas.
A Careem precisava de uma maneira de detectar e impedir perdas causadas por fraudes, que estavam prejudicando sua receita e a reputação da marca.
Ela recorreu à Amazon Web Services (AWS) e agora está reagindo com o uso de análises e do machine learning para identificar e bloquear automaticamente os fraudadores antes que qualquer crime possa ser cometido.
O Amazon Neptune é totalmente gerenciado, o que é uma grande vantagem para nós em termos de quantas pessoas precisaríamos alocar para o trabalho nesse projeto e dos custos potenciais de infraestrutura e manutenção.”
Kevin O’Brien
Cientista de dados sênior da Careem
Quando os fraudadores atacam
A Careem percebe que uma grande variedade de diferentes tipos de fraudes e criminosos estão sempre encontrando novas brechas para contornar as medidas específicas que a empresa adota para combater os padrões de fraude existentes detectados.
No passado, combater esses diferentes tipos de fraudes era um jogo interminável de gato e rato. A Careem costumava criar regras ou modelos de machine learning para cada tipo específico de fraude. Entretanto, isso era problemático em dois níveis.
Primeiro, a estratégia só permitia que a Careem identificasse e bloqueasse uma conta após a fraude ter sido cometida e detectada, ou seja, quando o dinheiro já havia sido perdido.
Em segundo lugar, os fraudadores conseguiam identificar rapidamente quando a Careem havia descoberto como detectar esse tipo de fraude e simplesmente continuavam e encontravam uma nova brecha para explorar.
Uma forma mais inteligente
Ficou claro que a Careem precisava de uma maneira mais inteligente e rápida de detectar contas fraudulentas e impedir fraudes antes que elas fossem cometidas.
“Em vez de criar continuamente ferramentas muito peculiares para detectar casos de uso de fraudes muito específicos, queríamos criar um projeto que fosse quase como um mecanismo de detecção geral para todos os usuários, independentemente do tipo de brecha encontrada ou do tipo de ataque que fosse tentado”, diz Kevin O'Brien, cientista de dados sênior da Careem.
A Careem optou por um banco de dados de grafos como forma de detectar padrões potencialmente fraudulentos em tempo real nas atividades de usuários e contas e avaliou vários dos principais fornecedores do mercado.
Ela escolheu a AWS e os recursos automatizados de análise e monitoramento em tempo real do Amazon Neptune, em parte porque ele é um serviço gerenciado.
“O Amazon Neptune é totalmente gerenciado, o que é uma grande vantagem para nós em termos de quantas pessoas precisaríamos alocar para o trabalho nesse projeto e dos custos potenciais de infraestrutura e manutenção”, diz O'Brien. “Em vez disso, tudo é totalmente gerenciado pela AWS.”
A Careem já estava usando a AWS para todas as suas operações de computação em nuvem e data warehouse, então optou por permanecer no mesmo ambiente para seu projeto de prevenção de fraudes.
A Careem também preferiu a linguagem query Gremlin, que oferece suporte ao Amazon Neptune, em vez de linguagens de consulta como a Cypher, usadas por outros provedores de bancos de dados de grafos. A Gremlin permite que os desenvolvedores escrevam consultas em uma variedade de linguagens de programação, incluindo Groovy, Java e Python.
Detectar padrões com foco na identidade
Para melhorar sua capacidade de detecção de fraudes usando o Amazon Neptune, a Careem começou a se concentrar na identidade dos usuários, bem como em seus esforços para lidar com tipos específicos de fraude à medida que estes surgiam.
O banco de dados de grafos do Amazon Neptune permite que a Careem faça conexões entre diferentes usuários e pontos de dados e identifique padrões que possam indicar atividades fraudulentas.
A primeira versão do projeto de prevenção de fraudes foi lançada em outubro de 2020 usando dados históricos de usuários que remontam a 2012, provenientes de fontes internas da Careem, como seu data warehouse. Esses dados são extraídos, transformados e depois formatados em arquivos CSV no Amazon Simple Storage Service (Amazon S3) antes de serem enviados ao Amazon Neptune. Esses dados históricos são adicionados em tempo real à medida que os usuários realizam novas ações, como usar um novo dispositivo para fazer login, adicionar um novo cartão de crédito, alterar um número de telefone ou fazer uma alteração de perfil. Em média, os dados são adicionados ou atualizados no grafo do Amazon Neptune mais de 100.000 vezes por dia.
Isso cria um cluster de dados conectado a cada usuário, que é analisado usando um mecanismo simples de análise algorítmica, criado pela Careem usando o Python e implantado sobre o Amazon Neptune.
Quando uma conta é sinalizada como potencialmente fraudulenta, ela é automaticamente bloqueada se os dados indicam que ela é uma conta historicamente não confiável ou é sinalizada para análise manual se for uma conta confiável ou de alto valor, como a de um cliente corporativo.
Redução das perdas com maior precisão
A Careem bloqueou dezenas de milhares de contas fraudulentas de usuários desde a implementação da primeira fase do projeto em outubro de 2020, e os resultados são impressionantes: cerca de 90% dos usuários que o sistema bloqueou automaticamente foram decisões corretas. Isso significa que a Careem está bloqueando essas contas falsas antes que qualquer fraude seja cometida, o que ajuda a reduzir as perdas.
Após o sucesso dessa primeira fase do projeto, a Careem agora está trabalhando com a AWS em uma versão atualizada que melhorará ainda mais a precisão usando o recurso de machine learning no Amazon Neptune ML.
Usando cerca de 10 vezes mais dados históricos, a Careem poderá aplicar aprendizado profundo avançado em vez de uma abordagem simples baseada em regras e treinar o sistema para que ele possa aprender a identificar o perfil de um usuário fraudulento no banco de dados de grafos. Isso permitirá uma recuperação muito melhor, em que o sistema é capaz de detectar corretamente mais contas fraudulentas entre todos os usuários analisados pelo sistema, melhorando ao mesmo tempo a precisão da previsão de fraudes muito além de 90%.
“Estamos muito confiantes de que essa segunda versão da nossa solução melhorará nossas capacidades atuais de prevenção de fraudes”, diz O'Brien. “E esse é outro ótimo motivo pelo qual escolhemos o Amazon Neptune.”
Sobre a Careem
A Careem, com sede em Dubai, é pioneira no mercado de caronas compartilhadas e agora está expandindo seus serviços para incluir transporte em massa, entregas e pagamentos. Fundada em 2012, a Careem tem operações em mais de 100 cidades em 14 países no Oriente Médio, na África e no Sul da Ásia. Ela foi adquirida pela Uber por USD 3,1 bilhões em 2019.
Benefícios da AWS
- Segurança e conformidade
- Agilidade e performance
- Disponibilidade
- Inovação
Serviços da AWS usados
Amazon Neptune
O Amazon Neptune é um serviço de banco de dados de grafos rápido, confiável e totalmente gerenciado que facilita o desenvolvimento e a execução de aplicações que trabalham com conjuntos de dados altamente conectados.
Amazon Redshift
Com o Redshift, você pode consultar e combinar exabytes de dados estruturados e semiestruturados em data warehouses, bancos de dados operacionais e data lakes usando o SQL padrão.
Amazon S3
O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e performance líder do setor.
Amazon SageMaker
O Amazon SageMaker ajuda cientistas e desenvolvedores de dados a preparar, criar, treinar e implantar modelos de machine learning (ML) de alta qualidade rapidamente reunindo um amplo conjunto de funcionalidades criadas especificamente para ML.
Comece a usar
Saiba mais sobre o Amazon Neptune. Um banco de dados de grafos rápido e confiável desenvolvido para a nuvem.