Funzionalità di Amazon Aurora

Perché Amazon Aurora?

Amazon Aurora è un servizio di database relazionale che unisce la velocità e la disponibilità dei database commerciali di fascia alta alla semplicità e al costo ridotto dei database open source. Aurora è completamente compatibile con MySQL e PostgreSQL, consentendo di eseguire le applicazioni e gli strumenti esistenti senza necessità di modifiche.

Prestazioni e scalabilità elevate

I test su benchmark standard come SysBench hanno mostrato un aumento della velocità di trasmissione effettiva fino a cinque volte rispetto a MySQL di serie e tre volte rispetto a PostgreSQL di serie su hardware simile. Aurora sfrutta varie tecniche software e hardware per garantire che il motore di database sia in grado di utilizzare appieno le risorse di calcolo, memoria e rete disponibili. Le operazioni I/O utilizzano tecniche basate su sistemi distribuiti, ad esempio i quorum, per migliorare e stabilizzare le prestazioni.

Amazon Aurora serverless è una configurazione on demand con scalabilità automatica per Aurora in cui il database si avvia, si spegne e aumenta o riduce automaticamente la capacità in base alle esigenze dell'applicazione. Con Amazon Aurora serverless è possibile eseguire un database relazionale nel cloud senza dover gestire istanze database. È possibile anche utilizzare le istanze Aurora Serverless v2 insieme a istanze con provisioning nei cluster di database nuovi o esistenti.

Puoi utilizzare le API di Amazon Relational Database Service (Amazon RDS) o la Console di gestione AWS per dimensionare verso l'alto o verso il basso le istanze con provisioning che sostengono l'implementazione. Le operazioni di scaling delle risorse di elaborazione vengono in genere completate in pochi minuti.

Aurora dimensiona automaticamente gli I/O per soddisfare le esigenze delle applicazioni più esigenti. Inoltre, aumenta le dimensioni del volume del database con l'aumentare delle esigenze di archiviazione. Il volume si amplia in base a incrementi di 10 GB, fino a un massimo di 128 TB. Non è necessario effettuare il provisioning di risorse di storage aggiuntive per far fronte all'eventuale crescita futura del database. Quando si utilizza la configurazione ottimizzata per l'I/O di Amazon Aurora, Aurora offre anche un risparmio sui costi fino al 40% quando la spesa di I/O supera il 25% della spesa del database Aurora. Per ulteriori informazioni, visita la pagina Aurora storage and reliability.

È possibile aumentare il throughput in lettura per supportare volumi elevati di richieste di applicazioni creando fino a quindici repliche di Amazon Aurora. Le repliche di Aurora condividono la stessa archiviazione dell'istanza di origine, riducendo i costi ed eliminando la necessità di eseguire scritture sui nodi di replica. Ciò consente di liberare una maggiore quantità di potenza di elaborazione per la gestione delle richieste di lettura e di ridurre il ritardo di replica fino a pochi millisecondi.

Aurora fornisce un endpoint di lettura, in modo da permettere all'applicazione di connettersi senza dover tenere traccia delle repliche man mano che vengono aggiunte e rimosse. Supporta inoltre la funzione di dimensionamento automatico, che consente di aggiungere o rimuovere automaticamente le repliche in risposta alle variazioni dei parametri prestazionali specificati. Per ulteriori informazioni, visita la pagina Using Amazon Aurora Auto Scaling with Aurora Replicas.

Aurora supporta repliche di lettura tra regioni diverse. Le repliche tra regioni offrono letture locali rapide agli utenti. Inoltre, ciascuna regione può avere altre quindici repliche di Aurora per dimensionare ulteriormente le letture locali. Per ulteriori informazioni, consulta la pagina Database globale Amazon Aurora.

Gli endpoint personalizzati permettono di distribuire carichi di lavoro ed eseguirne il bilanciamento del carico tra set diversi di istanze database. Ad esempio, è possibile effettuare il provisioning di un set di repliche Aurora per l'uso di un tipo di istanza con una maggiore capacità di memoria per eseguire un carico di lavoro di analisi dei dati. Un endpoint personalizzato può quindi favorire l'instradamento del carico di lavoro a queste istanze opportunamente configurate, mantenendo isolate dal carico di lavoro altre istanze.

Letture ottimizzate di Amazon Aurora è una nuova funzionalità dall'ottimo rapporto prezzo/prestazioni che offre una latenza delle query fino a 8 volte superiore e risparmi sui costi fino al 30% rispetto alle istanze che ne sono prive. È ideale per applicazioni con set di dati di grandi dimensioni che superano la capacità di memoria di un'istanza di database.

Le istanze di Letture ottimizzate utilizzano l’archiviazione a livello di blocco SSD locale basata su NVMe, disponibile su istanze r6gd e r6id basate su Graviton, per migliorare la latenza delle query delle applicazioni con set di dati che superano la capacità di memoria di un'istanza di database. Letture ottimizzate include miglioramenti delle prestazioni così come la memorizzazione nella cache a più livelli e oggetti temporanei per consentirti di sfruttare al meglio le istanze del database.

Con una latenza delle query fino a 8 volte migliorata, puoi eseguire efficacemente carichi di lavoro ad alta intensità di lettura e I/O come pannelli di controllo operativi, rilevamento delle anomalie e ricerche di somiglianze con pgvector. Letture ottimizzate di Amazon Aurora PostgreSQL con pgvector aumenta fino a 9 volte le query al secondo per la ricerca vettoriale nei carichi di lavoro che superano la memoria di istanza disponibile. Letture ottimizzate è disponibile per Aurora con compatibilità PostgreSQL.

Query in parallelo di Amazon Aurora fornisce query analitiche più veloci sui tuoi dati attuali. La portata del miglioramento delle prestazioni raggiunge anche due ordini di grandezza, senza sacrificare la velocità effettiva dei principali carichi di lavoro transazionali. L'invio del processo di query al livello di archiviazione di Aurora permette di aumentare notevolmente la potenza di calcolo riducendo al tempo stesso il traffico di rete. La funzionalità Parallel Query va utilizzata per eseguire simultaneamente carichi di lavoro transazionali e analitici nello stesso database Aurora. Parallel Query è disponibile per Aurora con compatibilità con MySQL.

Amazon DevOps Guru è un servizio di operazioni nel cloud basato sul machine learning (ML) che migliora la disponibilità delle applicazioni. Amazon DevOps Guru per RDS consente di utilizzare informazioni dettagliate basate su ML per rilevare e diagnosticare facilmente i problemi di database relazionali relativi alle prestazioni ed è progettato per risolverli in pochi minuti anziché in giorni. Gli sviluppatori e gli ingegneri DevOps possono utilizzare DevOps Guru per RDS per identificare automaticamente la causa principale dei problemi di prestazioni e ottenere suggerimenti intelligenti per affrontare il problema, senza dover ricorrere all'aiuto di esperti di database.

Per iniziare, vai alla Console di gestione Amazon RDS e abilita Approfondimenti sulle prestazioni di Amazon RDS. Una volta attivata la funzionalità Approfondimenti sulle prestazioni, accedi alla Console Amazon DevOps Guru e abilitala per le risorse Amazon Aurora, per altre risorse supportate o per l'intero account.

Disponibilità e durabilità elevate

Amazon RDS monitora continuamente l'integrità del database Aurora e dell'istanza Amazon Elastic Compute Cloud (Amazon EC2) sottostante. In caso di errore del database, Amazon RDS riavvierà automaticamente il database e i processi associati. Aurora non richiede la riesecuzione dei log di ripristino del database in seguito ad arresti anomali. Ciò consente di ridurre in modo sensibile i tempi di riavvio. Inoltre, il servizio isola la cache del buffer del database dai processi del database, consentendone in questo modo la conservazione in caso di riavvio del database.

In caso di errore dell'istanza, Aurora utilizza la tecnologia Amazon RDS Multi-AZ per automatizzare il failover su una delle quindici repliche Aurora create in una qualsiasi delle tre zone di disponibilità. Se non è stato effettuato il provisioning delle repliche Aurora, in caso di errore Amazon RDS tenterà automaticamente di creare una nuova istanza database Aurora. Riduci al minimo i tempi di failover sostituendo i driver MySQL e PostgreSQL della community con quelli compatibili open source e pronti per l'uso AWS JDBC Driver per MySQL e AWS JDBC Driver per PostgreSQL. Puoi inoltre utilizzare il Server proxy per RDS per ridurre i tempi di failover e migliorare la disponibilità. Quando si verificano i failover, Server proxy per Amazon RDS instrada le richieste direttamente alla nuova istanza del database, riducendo i tempi di failover fino al 66% e preservando al contempo le connessioni dell'applicazione.

Per le applicazioni distribuite a livello globale, è possibile utilizzare un database globale Aurora, in cui un singolo database Aurora può estendersi in diverse Regioni AWS per consentire letture locali rapide e un disaster recovery veloce. Un database globale Aurora utilizza la replica basata su archiviazione per replicare un database in più Regioni, con una latenza tipica inferiore a 1 secondo. È possibile utilizzare una Regione secondaria come opzione di backup nel caso in cui sia necessario un ripristino rapido a seguito di una riduzione delle prestazioni o un'interruzione regionale. Un database in una regione secondaria può essere elevato a piene capacità di lettura/scrittura in meno di 1 minuto. Per ulteriori informazioni, visita la pagina Using Amazon Aurora global databases.

Il volume di archiviazione del database di Aurora è segmentato in blocchi da 10 GiB e replicato su tre zone di disponibilità, con ciascuna zona di disponibilità che conserva 2 copie di ogni scrittura. L'archiviazione di Aurora è caratterizzata dalla tolleranza ai guasti, ovvero è in grado di gestire in modo trasparente la perdita di un massimo di due copie di dati senza ripercussioni sulla disponibilità delle operazioni di scrittura del database e di un massimo di tre copie senza ripercussioni sulla disponibilità delle operazioni di lettura. In più, lo spazio di archiviazione Aurora corregge automaticamente gli errori: i blocchi di dati e i dischi su cui vengono rilevati più spesso errori vengono sostituiti automaticamente.

La funzionalità di backup di Aurora consente di eseguire il ripristino point-in-time dell'istanza. In tal modo sarà possibile ripristinare il database a qualsiasi punto nel tempo compreso nel periodo di conservazione, fino agli ultimi 5 minuti. Il periodo di conservazione dei backup automatici può essere configurato per un intervallo di tempo massimo di 35 giorni. I backup automatici vengono archiviati in Amazon Simple Storage Service (Amazon S3), che è stato progettato per offrire una durabilità pari al 99,999999999%. I backup di Aurora sono automatici, incrementali e continui, e non hanno alcun impatto sulle prestazioni del database.

Gli snapshot DB sono backup avviati manualmente dall'utente dell'istanza salvata in Amazon S3 e conservati finché l'utente non li elimina in modo esplicito. Tale tipologia di snapshot usa snapshot incrementali automatici per ridurre il tempo e la quantità di archiviazione richiesti. È possibile creare una nuova istanza da uno snapshot DB in qualsiasi momento.

La funzione Backtrack ti permette di ripristinare rapidamente un database a uno stato precedente senza la necessità di recuperare i dati da un backup. Ciò consente un rapido recupero a seguito di errori utente, come l'abbassamento della tabella sbagliata o l'eliminazione erronea di una riga. Quando si abilita Backtrack, Aurora conserverà i record dei dati per la durata specificata di Backtrack. Per esempio, puoi impostare Backtrack in modo che ti permette di spostare il tuo database indietro di 72 ore. Backtrack completa l'operazione in pochi secondi, anche per database di grandi dimensioni, perché non è necessario copiare nessun record del database. Puoi andare indietro e avanti nel tempo, fino al punto appena prima dell'errore.

Backtrack è utile anche per lo sviluppo e il test, soprattutto in situazioni dove i test cancellano o invalidano i dati. Riporta semplicemente il database allo stato originale e sarà tutto pronto per un nuovo test. Puoi creare uno script che richiama Backtrack attraverso un'API, quindi esegue il test per una facile integrazione nel tuo framework di test. Backtrack è disponibile per Aurora con compatibilità con MySQL.

Altamente sicuro

Aurora viene eseguito in Amazon Virtual Private Cloud (Amazon VPC), che consente di isolare il database in una rete virtuale e di connettersi all'infrastruttura IT on-premise tramite VPN IPsec crittografati standard. Per ulteriori informazioni sul servizio di database relazionale (RDS) di Amazon in Amazon VPC, consulta la Guida per l'utente di Amazon RDS. Utilizzando Amazon RDS, inoltre, è possibile configurare le impostazioni del firewall e controllare l'accesso alla rete da parte delle istanze DB.

Aurora è integrato con AWS Identity and Access Management (IAM) e consente di controllare le operazioni che gli utenti e i gruppi di IAM sono autorizzati a eseguire su risorse Aurora specifiche (ad esempio istanze DB, snapshot DB, gruppi di parametri DB, abbonamenti a eventi DB e gruppi di opzioni DB). Inoltre, è possibile taggare le risorse Aurora e controllare le operazioni che gli utenti e i gruppi IAM sono autorizzati a eseguire sui gruppi di risorse con lo stesso tag (e valore di tag). Per ulteriori informazioni sull'utilizzo dell'integrazione IAM, consulta la documentazione di autenticazione dei database IAM.

Aurora consente di crittografare i database usando le chiavi create e gestite mediante AWS Key Management Service (KMS). In un'istanza del database in esecuzione con la crittografia di Amazon Aurora i dati inattivi memorizzati nell'archiviazione sottostante sono crittografati, analogamente ai backup automatici, agli snapshot e alle repliche incluse nello stesso cluster. Aurora usa il protocollo SSL (AES-256) per la protezione dei dati in transito.

Aurora consente di registrare gli eventi di database con un impatto minimo sulle prestazioni del database stesso. I log possono successivamente essere analizzati per gestione di database, sicurezza, governance, conformità normativa e altri scopi. È inoltre possibile monitorare l'attività inviando log di audit ad Amazon CloudWatch.

Amazon GuardDuty offre funzionalità di rilevamento delle minacce per Aurora al fine di aiutarti a identificare potenziali minacce ai dati archiviati nei database Aurora. GuardDuty RDS Protection delinea e monitora le attività di accesso ai database esistenti e nuovi nel tuo account e utilizza modelli di ML su misura per rilevare con precisione accessi sospetti ai database Aurora. Se viene rilevata una potenziale minaccia, GuardDuty genera una segnalazione di sicurezza che include i dettagli del database e le informazioni contestuali approfondite sull'attività sospetta. L'integrazione di Aurora con GuardDuty offre un accesso diretto ai log degli eventi di database senza richiederne la modifica ed è progettata per non alterare le prestazioni del database.

Convenienza

Non è previsto alcun impegno anticipato con Aurora. Si paga in base a una tariffa oraria per ogni istanza avviata. Una volta che l'istanza DB Aurora non serve più, è possibile eliminarla. Non sarà necessario effettuare il provisioning in eccesso di ulteriori quantità di spazio di archiviazione come misura di sicurezza in quanto verrà richiesto il pagamento solo dello spazio effettivamente consumato. Per ulteriori informazioni, visita la pagina dei prezzi di Aurora.

Aurora offre la flessibilità necessaria per ottimizzare la spesa del database scegliendo tra due opzioni di configurazione in base alle tue esigenze in termini di rapporto prezzo/prestazioni e prevedibilità/prezzo, a prescindere dal consumo di I/O della tua applicazione. Le due opzioni di configurazione sono Aurora I/O-Optimized e Aurora Standard. Nessuna delle due opzioni richiede il provisioning anticipato di I/O o spazio di archiviazione ed entrambe sono in grado di dimensionare il numero di I/O per supportare le applicazioni più impegnative.

Aurora I/O-Optimized è una configurazione di cluster di database. Offre prestazioni migliori in termini di prezzo per i clienti con carichi di lavoro ad alta intensità di I/O, come sistemi di elaborazione dei pagamenti, sistemi di e-commerce e applicazioni finanziarie. Se la spesa I/O supera il 25% della spesa totale del database Aurora, puoi risparmiare fino al 40% sui costi per carichi di lavoro ad alta intensità di I/O con Aurora ottimizzato per I/O. Con Aurora ottimizzato per I/O si pagano le istanze database e lo spazio di archiviazione. Poiché non sono previsti costi per le operazioni I/O di lettura e scrittura, la prevedibilità dei prezzi è garantita per tutte le applicazioni, a prescindere dalla variabilità degli I/O.

Aurora Standard è una configurazione di cluster di database che offre prezzi convenienti per la maggior parte delle applicazioni con un utilizzo di I/O da basso a moderato. Con Aurora Standard si pagano istanze di database, spazio di archiviazione e I/O pay-per-request.

Per un'applicazione ad alta intensità di analisi, i costi di I/O sono quelli che generalmente influiscono di più sui costi del database. Le operazioni I/O vengono eseguite dal motore di database Aurora nel relativo layer di archiviazione virtualizzato basato su SSD. Ogni operazione di lettura delle pagine del database viene considerata un I/O. Il motore del database Aurora esegue le letture sul livello di archiviazione per recuperare le pagine del database non presenti nella cache del buffer. Ogni pagina del database è di 8 KB in Aurora con compatibilità PostgreSQL e 16 KB in Aurora con compatibilità MySQL.

Il servizio Aurora è stato sviluppato in modo da eliminare le operazioni I/O non necessarie per ridurre i costi e garantire la disponibilità delle risorse per la gestione del traffico di lettura/scrittura. Le operazioni I/O di scrittura vengono utilizzate solo durante l'invio dei record di log delle transazioni al layer di archiviazione allo scopo di rendere durevoli le letture. Le operazioni I/O di scrittura vengono conteggiate in unità di 4 KB. Ad esempio, un record di log delle transazioni la cui dimensione è pari a 1.024 byte verrà considerato come un'operazione I/O. Tuttavia, le operazioni di scrittura simultanee il cui log delle transazioni ha dimensioni minori di 4 KB possono essere raggruppate in batch dal motore di database Aurora per ottimizzare il consumo di I/O. A differenza dei motori di database tradizionali, Aurora non invia mai le pagine di database modificate al layer di archiviazione. Ciò consente di ridurre ulteriormente il consumo di I/O.

È possibile visualizzare il numero di operazioni I/O utilizzate da un'istanza Aurora nella Console di gestione AWS. Per verificare il consumo di I/O, passa alla sezione RDS della console, controlla l'elenco delle istanze, seleziona le istanze di Aurora e quindi verifica i parametri "Billed read operations" ("Operazioni di lettura fatturate") e "Billed write operations" ("Operazioni di scrittura fatturate") nella sezione relativa al monitoraggio.

Le operazioni I/O di lettura e scrittura vengono addebitate quando si configurano i cluster di database nella configurazione Aurora Standard. Non vengono invece addebitati costi per le operazioni I/O di lettura e scrittura quando si configurano i cluster di database su ottimizzato per l'I/O di Aurora. Per ulteriori informazioni sui prezzi delle operazioni I/O, visita la pagina dei prezzi di Amazon Aurora.

Letture ottimizzate di Aurora per Aurora PostgreSQL offre ai clienti con applicazioni sensibili alla latenza e set di lavoro di grandi dimensioni un'alternativa interessante in termini di rapporto prezzo/prestazioni per soddisfare i loro Accordi sul livello di servizio (SLA) aziendali. I clienti hanno inoltre una maggiore flessibilità per far crescere i propri set di dati senza la necessità di eseguire frequentemente l'upsize delle istanze del database per ottenere una maggiore capacità di memoria. Letture ottimizzate include miglioramenti delle prestazioni come la memorizzazione nella cache a più livelli e gli oggetti temporanei.

La cache a più livelli offre una latenza delle query fino a 8 volte superiore e risparmi sui costi fino al 30% per applicazioni ad alta intensità di lettura e I/O come pannelli di controllo operativi, rilevamento delle anomalie e ricerche di similarità basate su vettori. Questi vantaggi si ottengono quando i dati memorizzati nella cache vengono automaticamente rimossi dalla buffer cache del database in memoria sullo storage locale per velocizzare gli accessi successivi a tali dati. La memorizzazione nella cache a più livelli è disponibile solo per Aurora PostgreSQL con configurazione Aurora I/O ottimizzata.

Gli oggetti temporanei consentono un'elaborazione più rapida delle query posizionando le tabelle temporanee generate da Aurora PostgreSQL nell'archiviazione locale, migliorando le prestazioni delle query che coinvolgono ordinamenti, aggregazioni di hash, join ad alto carico e altre operazioni a uso intensivo di dati.

Servizio completamente gestito

Iniziare a usare Aurora è estremamente facile. È sufficiente avviare una nuova istanza database di Aurora utilizzando la Console di gestione Amazon RDS, la CLI oppure con una singola chiamata API. Le istanze database Aurora sono preconfigurate con i parametri e le impostazioni ottimali per la classe di istanza database selezionata. Sarà pertanto possibile avviare un'istanza database e collegarla all'applicazione in pochi minuti senza ulteriori configurazioni. I gruppi di parametri DB forniscono funzionalità di controllo granulare e ottimizzazione del database.

Amazon Aurora fornisce metriche Amazon CloudWatch per le istanze database senza alcun costo aggiuntivo. È possibile usare la Console di gestione AWS per visualizzare oltre 20 metriche operative chiave per le istanze database, incluse le metriche relative a elaborazione, memoria, storage, throughput delle query, numero di riscontri nella cache e connessioni attive. Inoltre, è possibile utilizzare Enhanced Monitoring per raccogliere parametri per l'istanza del sistema operativo su cui è in esecuzione il database. È possibile utilizzare Approfondimenti sulle prestazioni di Amazon RDS, lo strumento di monitoraggio del database dotato di un pannello di controllo intuitivo che visualizza il carico del database, permettendo di individuare con facilità problemi di prestazioni del database e intraprendere azioni correttive. Infine, è possibile utilizzare Amazon DevOps Guru per RDS per rilevare facilmente i problemi di prestazioni, identificare automaticamente la causa principale dei problemi di prestazioni e ottenere raccomandazioni intelligenti per risolvere il problema senza dover ricorrere all'aiuto di esperti di database.

Le implementazioni blu/verde di Amazon RDS consentono di effettuare aggiornamenti del database più sicuri, semplici e veloci senza alcuna perdita di dati su Aurora edizione compatibile con MySQL e Aurora edizione compatibile con PostgreSQL. In pochi passaggi, le implementazioni blu/verde creano un ambiente di staging che rispecchia l'ambiente di produzione e mantengono sincronizzati i due ambienti utilizzando la replica logica. Puoi apportare modifiche, come aggiornamenti di versione principale/secondaria, variazioni allo schema e rettifiche alle impostazioni dei parametri, senza influire sul carico di lavoro di produzione.

Quando promuovi il tuo ambiente di staging, le implementazioni blu/verdi bloccano le scritture negli ambienti blu e verdi fino al completamento del processo di switchover. Le implementazioni blu/verde utilizzano guardrail di switchover integrati che determinano il timeout della promozione se supera il tempo di inattività massimo tollerabile, rilevano errori di replica, controllano lo stato dell'istanza e svolgono molte altre funzioni.

Con Aurora, il database sarà sempre aggiornato con le patch più recenti. È inoltre possibile controllare se e quando vengono applicate patch alle istanze attraverso la gestione delle versioni del motore DB. Ove possibile, Aurora utilizza operazioni di patch senza interruzioni: se appare una finestra temporale idonea, l'istanza viene aggiornata al momento, le sessioni delle applicazioni vengono mantenute e il server del motore di database si riavvia mentre la patch è in corso, determinando solo un calo transitorio (di circa 5 secondi) della velocità di trasmissione effettiva.

Aurora è in grado di inviare via email o SMS notifiche relative a eventi di database importanti, ad esempio il failover automatico. È possibile utilizzare la Console di gestione AWS o le API di Amazon RDS per ricevere notifiche relative a oltre 40 eventi di database diversi associati ai database Aurora.

Aurora supporta operazioni rapide ed efficienti, in cui interi cluster di database multi-terabyte possono essere clonati in pochi minuti. La clonazione è utile per numerosi scopi, tra cui sviluppo di applicazioni, test, aggiornamenti di database ed esecuzione di query di analisi. La disponibilità immediata dei dati può accelerare notevolmente lo sviluppo software e aggiornare progetti, oltre a rendere più accurata l'analisi.

È possibile clonare un database Aurora in poche fasi senza incorrere in costi di archiviazione, a meno che non si utilizzi spazio aggiuntivo per archiviare modifiche dei dati.

Il database Aurora può essere avviato/arrestato manualmente in poche operazioni. Per questo motivo, utilizzare Aurora per lo sviluppo e il testing è ancora più semplice e conveniente, perché il database non deve per forza essere sempre in esecuzione. L'arresto del database non provoca la cancellazione dei dati. Per ulteriori dettagli, consulta la documentazione sull'avvio/arresto.

Integrazioni Zero-ETL

L'integrazione Zero-ETL di Amazon Aurora con Amazon Redshift consente l'analisi e il ML quasi in tempo reale utilizzando Amazon Redshift su petabyte di dati transazionali provenienti da Aurora, eliminando la necessità di creare e gestire pipeline di dati complesse che eseguono operazioni di estrazione, trasformazione e caricamento (ETL). I dati transazionali vengono replicati automaticamente e continuamente in pochi secondi dopo essere stati scritti in Aurora e vengono resi disponibili in Amazon Redshift in modo ottimale.

Una volta che i dati sono disponibili in Amazon Redshift, è possibile iniziare immediatamente ad analizzarli e applicare funzionalità avanzate come la condivisione dei dati, le viste materializzate e il ML di Amazon Redshift per ottenere approfondimenti completi e predittivi. Potrai consolidare diverse tabelle provenienti da più cluster di database Aurora e replicare i tuoi dati in un data warehouse di Amazon Redshift per eseguire analisi unificate su più applicazioni e origini dati. Quando si utilizzano sia Aurora Serverless sia Amazon Redshift serverless, è possibile generare analisi quasi in tempo reale sui dati transazionali senza la necessità di gestire alcuna infrastruttura per le pipeline di dati. Leggi la nostra documentazione su come lavorare con le integrazioni Zero-ETL di Aurora con Amazon Redshift.

IA generativa

Aurora offre funzionalità per consentire ai modelli di machine learning (ML) e intelligenza artificiale (IA) generativa di lavorare con i dati archiviati in Aurora in tempo reale e senza spostare i dati. Con Amazon Aurora PostgreSQL Compatible Edition, è possibile accedere alle funzionalità di database vettoriale per archiviare, cercare, indicizzare e interrogare gli incorporamenti ML con l’estensione pgvector.

Un incorporamento vettoriale è una rappresentazione numerica del significato semantico di contenuti come testo, immagini e video. L'IA generativa e altri sistemi IA/ML utilizzano gli incorporamenti per acquisire il significato semantico dell'input di contenuto in un modello linguistico di grandi dimensioni (LLM). È possibile archiviare nei propri database Aurora embedding da modelli di ML e IA, come quelli di Amazon Bedrock e Amazon SageMaker. Leggi la nostra documentazione sulle versioni delle estensioni per Aurora PostgreSQL.

Amazon Aurora PostgreSQL è disponibile come knowledge base per Amazon Bedrock per collegare le origini dati private della tua organizzazione ai modelli di fondazione (FM) e abilitare flussi di lavoro di generazione potenziata tramite recupero (RAG) su di essi. Ciò rende i FM più informati sul tuo dominio e sulla tua organizzazione specifici. Leggi la nostra documentazione su come utilizzare Aurora PostgreSQL come knowledge base per Amazon Bedrock.

Il machine learning di Aurora (Aurora ML) semplifica anche l'aggiunta di previsioni tramite modelli di IA generativa al database Aurora. Aurora ML espone i modelli ML come funzioni SQL, consentendo di utilizzare il linguaggio SQL standard per richiamare modelli di ML, trasferirvi dati e restituire previsioni, riepiloghi di testo o sentiment come risultati di query. Con Aurora ML è possibile aggiungere nuovi embedding al proprio database Aurora PostgreSQL con l'estensione pgvector in tempo reale tramite chiamate periodiche al modello SageMaker o Amazon Bedrock, che restituisce gli embedding più recenti e aggiornati.

Supporto per la migrazione

Aurora supporta gli strumenti di importazione ed esportazione MySQL standard. È inoltre possibile creare in modo semplice e rapido un nuovo database Aurora da uno snapshot DB di Amazon RDS per MySQL. Le operazioni di migrazione basate su snapshot DB vengono in genere completate in meno di un'ora, ma tale durata può variare in base alla quantità e al formato dei dati interessati dalla migrazione.

In alternativa, AWS Database Migration Service (AWS DMS) offre strumenti nativi integrati all'interno della console DMS per una migrazione senza interruzioni. Senza istanze di replica da assegnare o dimensionare, è possibile avviare una migrazione del database con pochi semplici clic e pagare solo su base oraria per il tempo utilizzato.

È inoltre possibile configurare la replica basata su binlog tra un database Aurora nell'edizione compatibile con MySQL e un database MySQL esterno in esecuzione all'interno o all'esterno di AWS.

Aurora supporta gli strumenti di importazione ed esportazione PostgreSQL standard, inclusi pg_dump e pg_restore. Aurora supporta anche l'importazione di snapshot da Amazon RDS per PostgreSQL e la replica con AWS Database Migration Service (AWS DMS).

Aurora offre un ambiente ideale per trasferire i carichi di lavoro del database dai database commerciali. Aurora ha capacità funzionali che si avvicinano molto a quelle dei motori di database commerciali e offre le prestazioni, la durata e l'elevata disponibilità di livello aziendale richieste dalla maggior parte dei carichi di lavoro di database aziendali. AWS Database Migration Service (AWS DMS) può accelerare le migrazioni di database verso Aurora con funzionalità gestite come DMS Schema Conversion e DMS Serverless. DMS Schema Conversion valuterà e convertirà automaticamente gli schemi e gli oggetti di origine per renderli compatibili con il cluster Aurora di destinazione. Invece, DMS Serverless automatizza la fornitura, il monitoraggio e il dimensionamento delle risorse di migrazione.

Babelfish per Aurora PostgreSQL è una nuova funzionalità per Aurora edizione compatibile con PostgreSQL che permette ad Aurora di comprendere i comandi provenienti da applicazioni scritte per Microsoft SQL Server. Con Babelfish, Aurora PostgreSQL comprende T-SQL, il dialetto SQL esclusivo di Microsoft SQL Server, e supporta lo stesso protocollo di comunicazione, di modo che le app di tua proprietà che erano state scritte originariamente per SQL Server possano ora funzionare con Aurora con un minor numero di modifiche del codice. Conseguentemente, lo sforzo richiesto per modificare e spostare applicazioni eseguite su SQL Server 2005 (o su altri più recenti) ad Aurora è ridotto, aspetto che porta a migrazioni più veloci, più convenienti e meno rischiose. Babelfish è una funzionalità integrata di Aurora e non implica alcun costo aggiuntivo. Puoi abilitare Babelfish nel tuo cluster Aurora in poche fasi all'interno della console RDS.

Produttività sviluppatori

Trusted Language Extensions (TLE) per PostgreSQL è un kit di sviluppo e un progetto open source che ti consente di creare rapidamente estensioni ad alte prestazioni e di eseguirle in modo sicuro su Amazon Aurora senza bisogno di AWS per certificare il codice. Gli sviluppatori possono utilizzare i linguaggi attendibili più diffusi, come JavaScript, PL/pgSQL, Perl e SQL, per scrivere estensioni in modo sicuro. TLE è progettato per impedire l'accesso a risorse non sicure e limita i difetti di estensione a una singola connessione al database. I DBA beneficiano di un controllo online dettagliato su chi può installare le estensioni, con la possibilità di creare un modello di autorizzazioni per eseguirle. TLE è disponibile per i clienti Aurora senza costi aggiuntivi.

Aurora propone funzionalità di machine learning direttamente dal database, permettendoti di aggiungere alle applicazioni previsioni basate su machine learning attraverso il linguaggio di programmazione SQL. Con un’integrazione semplice, sicura e ottimizzata tra Aurora e i servizi di machine learning di AWS, puoi accedere a una vasta selezione di algoritmi di machine learning senza dover creare integrazioni personalizzate o trasferire dati. Scopri di più sul machine learning di Aurora.

Aurora opera con Server proxy per Amazon RDS, il proxy di database a disponibilità elevata e completamente gestito che rende le applicazioni più scalabili, sicure e resistenti agli errori del database. RDS Proxy permette alle applicazioni di raggrupparsi e condividere connessioni stabilite con il database, migliorando l'efficienza del database e la scalabilità delle applicazioni. Riduce i tempi di failover connettendosi automaticamente a una nuova istanza database preservando le connessioni ad applicazioni. Potenzia la sicurezza tramite le integrazioni con AWS IAM e AWS Secrets Manager.

API di dati è un'API HTTPS sicura e facile da usare per l'esecuzione di query SQL sui database Aurora che accelera lo sviluppo di applicazioni moderne. API di dati elimina le attività di configurazione della rete e delle applicazioni necessarie per connettersi in modo sicuro a un database Aurora, rendendo l'accesso ad Aurora facile come una chiamata API. API di dati elimina l'uso di driver di database e software di raggruppamento delle connessioni lato client. Inoltre, migliora la scalabilità delle applicazioni raggruppando e condividendo automaticamente le connessioni al database. API di dati potenzia la sicurezza tramite le integrazioni con AWS IAM e AWS Secrets Manager.

Gli sviluppatori possono chiamare API di dati tramite applicazioni create con un SDK AWS. API di dati fornisce anche l'accesso ai database Aurora per le API GraphQL di AWS AppSync.