En este documento se presenta el algoritmo Random Cut Forest, que detecta anomalías en datos de streaming en tiempo real. Hemos implementado el algoritmo como función SQL integrada en Amazon Kinesis Data Analytics, que es un servicio de AWS totalmente administrado que facilita el análisis de datos de streaming en tiempo real con SQL.
Este documento fue publicado en Proceeedings of the 33rd International Conference on Machine Learning, Nueva York, NY, EE.UU., 2016. JMLR: W&CP volumen 48. Copyright 2016 del autor o los autores.