A cosa serve l'integrazione di Amazon Redshift per Apache Spark?
Integrazione di Amazon Redshift per Apache Spark semplifica e accelera le applicazioni Apache Spark che accedono ai dati di Amazon Redshift da servizi di analisi AWS come Amazon EMR, AWS Glue e Amazon SageMaker. Utilizzando Amazon EMR, AWS Glue e SageMaker, puoi creare rapidamente applicazioni Apache Spark che leggono e scrivono nel data warehouse Amazon Redshift senza compromettere le prestazioni o la coerenza transazionale. Integrazione di Amazon Redshift per Apache Spark utilizza anche credenziali basate su AWS Identity Access and Management (IAM) per migliorare la sicurezza. Con Integrazione di Amazon Redshift per Apache Spark, non è necessaria alcuna configurazione né manutenzione manuale di versioni non certificate di connettori di terze parti. Puoi avviare i processi di Apache Spark utilizzando i dati di Amazon Redshift in pochi secondi. Questa nuova integrazione migliora le prestazioni delle applicazioni Apache Spark utilizzando i dati di Amazon Redshift.
Vantaggi di Amazon Redshift
Come funziona
Casi d'uso
Clienti
Huron è una società globale di servizi professionali che collabora con i clienti per mettere in pratica le possibilità creando strategie solide, ottimizzando le operazioni, accelerando la trasformazione digitale e consentendo alle aziende e ai loro dipendenti di plasmare il proprio futuro.
"Diamo ai nostri ingegneri la possibilità di creare le loro pipeline di dati e applicazioni con Apache Spark utilizzando Python e Scala. Volevamo una soluzione su misura che semplificasse le operazioni e fornisse ai nostri clienti un servizio più rapido ed efficiente ed è quello che otteniamo con la nuova integrazione di Amazon Redshift per Apache Spark".
Corey Johnson, responsabile architetto dei dati - Huron Consulting
GE Aerospace è un fornitore globale di motori a reazione, componenti e sistemi per aerei commerciali e militari. L'azienda progetta, sviluppa e produce motori a reazione dalla prima guerra mondiale.
GE Aerospace utilizza le analisi di AWS e Amazon Redshift per ottenere informazioni aziendali critiche che favoriscono importanti decisioni aziendali. Con il supporto della copia automatica di Amazon S3, possiamo creare pipeline di dati più semplici per spostare i dati da Amazon S3 ad Amazon Redshift. I nostri team di prodotti di dati possono accedere ai dati e fornire informazioni agli utenti finali più rapidamente. Dedichiamo più tempo ad aggiungere valore attraverso i dati e meno tempo alle integrazioni".
Alcuin Weidus, architetto dei dati principale senior - GE Aerospace
The Goldman Sachs Group, Inc. è un'istituzione finanziaria leader a livello mondiale che offre un'ampia gamma di servizi finanziari nei settori dell'investment banking, dei titoli, della gestione degli investimenti e del consumer banking a una clientela ampia e diversificata che comprende aziende, istituzioni finanziarie, enti pubblici e utenti privati.
"Il nostro obiettivo è fornire un accesso self-service ai dati a tutti gli utenti di Goldman Sachs. Attraverso Legend, la nostra piattaforma open source di gestione e governance dei dati, consentiamo agli utenti di sviluppare applicazioni e di ricavare informazioni basate sui dati, collaborando con il settore dei servizi finanziari. Con l'integrazione di Amazon Redshift per Apache Spark, il nostro team della piattaforma di dati sarà in grado di accedere ai dati di Amazon Redshift con passaggi manuali minimi, consentendo processi ETL senza codice che daranno ai nostri ingegneri la possibilità di concentrarsi più facilmente sul perfezionamento del loro flusso di lavoro e di raccogliere informazioni complete e tempestive. Poiché i nostri utenti possono ora accedere facilmente ai dati più recenti in Amazon Redshift, ci aspettiamo un miglioramento nelle prestazioni delle applicazioni e una maggiore sicurezza".
Neema Raphael, Chief Data Officer - Goldman Sachs