Perché EMR?
Amazon EMR è la piattaforma cloud big data leader del settore per l'elaborazione dei dati, l'analisi interattiva e il machine learning (ML) che utilizza framework open source come Apache Spark, Apache Hive e Presto. I prezzi di Amazon EMR sono chiari e semplici da calcolare: si paga una tariffa per ogni secondo utilizzato, con una tariffa minima di 1 minuto. Un cluster a 10 nodi in esecuzione per 10 ore ha lo stesso costo di un cluster a 100 nodi in esecuzione per un'ora. Il prezzo di Amazon EMR dipende dal modo in cui implementi le tue applicazioni EMR. È possibile implementarle su cluster EMR con istanze Amazon Elastic Cloud Compute (Amazon EC2), su AWS Outposts, su cluster Amazon Elastic Kubernetes Service (Amazon EKS) o con EMR serverless. Puoi eseguire Amazon EKS su AWS utilizzando EC2 o AWS Fargate.
Ti verranno addebitati i costi standard per gli indirizzi IPv4 pubblici utilizzati con Amazon EMR su cluster EC2, Amazon EMR su cluster EKS e applicazioni Amazon EMR serverless. Per ulteriori informazioni, visita la sezione dedicata agli indirizzi IPv4 pubblici della pagina dei prezzi di VPC.
Calcolatore prezzi AWS
Calcola il costo di Amazon EMR e dell'architettura in un unico preventivo.
Amazon EMR su Amazon EC2
Questo prezzo è relativo alle applicazioni Amazon EMR in esecuzione su cluster Amazon EMR con istanze Amazon EC2.
Il prezzo Amazon EMR viene aggiunto al prezzo Amazon EC2 (il prezzo per i server sottostanti) e al prezzo Amazon Elastic Block Store (Amazon EBS) (se si allegano volumi Amazon EBS). Anche questi vengono fatturati al secondo, con una tariffa minima di 1 minuto. È possibile scegliere tra una varietà di opzioni di prezzo EC2, tra cui On-Demand (mostrata di seguito), istanze riservate di un anno e tre anni, Savings Plans di Capacità, e istanze Spot. Le istanze Spot sono capacità EC2 di riserva disponibile con uno sconto fino al 90% rispetto ai prezzi on demand. Per visualizzare gli sconti sui prezzi delle istanze spot rispetto alle istanze on demand, filtrare i risultati nella pagina del Consulente istanze spot per "Tipi di istanze supportati da EMR".
Amazon EMR su Amazon EKS
Questo prezzo è per Amazon EMR su cluster Amazon EKS.
Il prezzo di Amazon EMR viene aggiunto ai prezzi di Amazon EKS o qualsiasi altro servizio utilizzato con EKS. Puoi eseguire EKS su AWS utilizzando EC2 o AWS Fargate. Se utilizzi EC2 (inclusi i gruppi di nodi gestiti EKS), i prezzi sono calcolati in base alle risorse AWS, ad esempio istanze di EC2 o volumi EBS, che vengono create per l'utilizzo dei nodi (worker) di Kubernetes. Vedi informazioni dettagliate sui prezzi allapagina dei prezzi EC2. Se utilizzi AWS Fargate, i prezzi vengono calcolati in base alle risorse vCPU e di memoria impiegate dal momento in cui inizia il download dell'immagine del container fino al termine del pod di Amazon EKS, arrotondati al secondo più vicino. È prevista una tariffa minima di un minuto. Per informazioni dettagliate sui prezzi, visita la pagina dei prezzi di AWS Fargate.
I prezzi di Amazon EMR su Amazon EKS vengono calcolati in base alla vCPU e alle risorse di memoria utilizzate dal momento in cui inizi a scaricare l'immagine dell'applicazione EMR fino al termine del pod EKS, arrotondato al secondo più vicino. I prezzi si basano sulle risorse vCPU e di memoria necessarie per completare l'attività o il pod.
Amazon EMR su AWS Outposts
Il prezzo di Amazon EMR su AWS Outposts è lo stesso delle istanze basate su cloud di EMR. Per maggior dettagli sui prezzi di AWS Outposts, consulta la pagina dei prezzi di AWS Outposts.
Amazon EMR Serverless
Con EMR Serverless non sono previsti pagamenti anticipati, paghi solo le risorse che usi. Il pagamento è in base alle risorse vCPU, di memoria e di archiviazione utilizzate dalle tue applicazioni.
Con EMR Serverless, crei applicazioni utilizzando una versione framework open source e invii i lavori all'applicazione. Come parte della descrizione del lavoro, puoi indicare il numero minimo e massimo di dipendenti in contemporanea, oltre alla vCPU, alla memoria e all'archiviazione disponibile per ogni dipendente. EMR aggiunge e rimuove automaticamente i dipendenti in base ai requisiti del lavoro, come espresso dai limiti che hai specificato. Le tre dimensioni di calcolo, memoria e archiviazione per i dipendenti possono essere configurate in modo indipendente. È possibile scegliere tra 1 vCPU, 2 vCPU, 4 vCPU, 8 vCPU o 16 vCPU per lavoratore, e da 2 a 120 GB di memoria per lavoratore in incrementi da 1 GB a 8 GB. Per le opzioni di archiviazione, sono disponibili un’archiviazione standard da 20 GB a 200 GB per lavoratore e un’archiviazione ottimizzata per la riproduzione casuale da 20 GB a 2 TB per lavoratore.
Verranno addebitati i costi per le risorse aggregate di vCPU, di memoria e di archiviazione utilizzate a partire dal momento in cui i lavoratori sono pronti a eseguire il carico di lavoro fino a quando lo terminano, arrotondando al secondo più vicino e considerando il tempo di un minuto come minimo. Se configuri la tua applicazione in modo che i dipendenti inizino all'avvio di quest’ultima, i dipendenti richiesti inizieranno quando avvierai la tua applicazione e termineranno quando l'arresterai o quando l'applicazione resterà inattiva.
Nota: quando utilizzi le immagini personalizzate, ti vengono addebitati i costi per la vCPU aggregata, la memoria e le risorse di archiviazione utilizzate a partire dal momento in cui EMR Serverless avvia il download dell'immagine fino a quando i dipendenti lo terminano, arrotondando al secondo più vicino e considerando il tempo di 1 minuto come minimo.
Dettagli dei prezzi (calcolo e memoria)
Il prezzo si basa sull'utilizzo di vCPU, memoria e risorse di archiviazione da parte dei dipendenti, sommando l'utilizzo di ciascun dipendente.
-
Linux/x86
-
Linux/ARM
-
Linux/x86
-
-
Linux/ARM
-
Dettagli dei prezzi (archiviazione temporanea)
Archiviazione standard: i primi 20 GB di archiviazione temporanea sono predefiniti per tutti i dipendenti. Si pagherà solo per l'archiviazione aggiuntiva che viene configurata per dipendente.
Archiviazione Shuffle Optimized: paghi l'intero spazio di archiviazione configurato per lavoratore, inclusi i primi 20 GB.
Configurazioni dipendente supportate
CPU | Valori di memoria | Archiviazione temporanea |
1 vCPU | Min. 2 GB e Max. 8 GB, in incrementi da 1 GB | Da 20 GB a 200 GB |
2 vCPU | Min. 4 GB e Max. 16 GB, in incrementi da 1 GB | Da 20 GB a 200 GB |
4 vCPU | Min. 8 GB e Max. 30 GB, in incrementi da 1 GB | Da 20 GB a 200 GB |
8 vCPU | Min. 16 GB e Max. 60 GB, in incrementi da 4 GB | Da 20 GB a 200 GB |
16 vCPU | Min. 32 GB e Max. 120 GB, in incrementi da 8 GB | Da 20 GB a 200 GB |
Durata
La durata viene calcolata dal momento in cui un dipendente è pronto a eseguire il tuo carico di lavoro fino al momento in cui termina la sua attività, arrotondando al secondo più vicino e considerando il tempo di 1 minuto come minimo.
Costi aggiuntivi
Potrebbero essere addebitati costi aggiuntivi se le tue applicazioni utilizzano altri servizi AWS. Ad esempio, se la tua applicazione utilizza Amazon Simple Storage Service (S3) per archiviare ed elaborare i dati, ti vengono addebitate le tariffe standard previste per Amazon S3. Se sposti i dati da origini come Amazon S3, Amazon Relational Database Service (RDS) o Amazon Redshift, ti vengono addebitate le tariffe di richieste e trasferimento dati standard. Se utilizzi Amazon CloudWatch, ti vengono addebitate le tariffe standard per i log e gli eventi CloudWatch.
Amazon EMR WAL
Questo prezzo si riferisce ad Amazon EMR su cluster EC2 con applicazioni Apache HBase che utilizzano Amazon EMR WAL. Apache HBase Write Ahead Log consente di registrare tutte le modifiche ai dati in uno spazio di archiviazione basato su file. Con Amazon EMR su EC2, puoi scrivere i tuoi log write-ahead di Apache HBase su Amazon EMR WAL, un livello di archiviazione gestito durevole che sopravvive al tuo cluster. Nel caso in cui il cluster, o nei rari casi in cui la zona di disponibilità diventi non integra o non disponibile, puoi creare un nuovo cluster, indirizzarlo alla stessa directory principale di Amazon S3 e allo stesso spazio di lavoro Amazon EMR WAL e ripristinare automaticamente i dati in WAL entro pochi minuti. Per ulteriori informazioni, consulta la documentazione Amazon EMR WAL.
Con EMR WAL i prezzi sono calcolati in base all’uso effettivo. Se disponi di un cluster attivo configurato per utilizzare il WAL, ti verrà addebitato lo spazio di archiviazione EMR WAL in base all'utilizzo fatturato come EMR-WAL-WALHours, scritture come WriteRequestGiB e letture come ReadRequestGiB.
EMR-WAL-WALHours: EMR WAL creerà un WAL per Regione Apache HBase. Una volta terminato il cluster, se ci sono ancora dati in EMR WAL che non sono stati scaricati su Amazon S3, potrai recuperarli dati avviando un cluster di ripristino oppure potrai scegliere di ripulire il WAL creando un cluster temporaneo e utilizzando la CLI di EMR WAL per eliminare le risorse EMR WAL. Se non si eliminano esplicitamente i dati EMR WAL, EMR WAL li conserverà e addebiterà all'utente i dati non eliminati per 30 giorni. Di seguito è riportato un esempio.
ReadRequestGiB e WriteRequestGiB: queste due dimensioni sono per le richieste di lettura e scrittura. Le chiamate all'API Apache HBase per scrivere dati nella tabella su un cluster con EMR WAL vengono fatturate come WriteRequestGiB. Le scritture EMR WAL avverranno per tutte le scritture di Apache HBase, come le operazioni `Put`. Le chiamate API Apache HBase per leggere i dati dal tuo EMR WAL durante le operazioni di ripristino di Apache HBase vengono fatturate come ReadRequestGiB. Le letture e le scritture vengono addebitate in base alle dimensioni degli elementi e alle fatture EMR con un minimo di 1 byte.
Esempi di prezzo
Esempio 1: EMR su EC2
Prezzo basato sui prezzi della regione Stati Uniti orientali 1.
Supponi di eseguire un'applicazione Amazon EMR implementata su Amazon EC2 e di utilizzare un'istanza c4.2xlarge EC2 come nodo principale e due istanze c4.2xlarge EC2 come nodi principali. Ti verranno addebitati sia l'EMR che i nodi EC2. Se lavori per un mese, con un utilizzo del 100% durante quel mese e utilizzi i prezzi on demand per EC2, i tuoi addebiti saranno:
Nodo principale:
Addebiti EMR = 1 istanza x 0,105 USD all'ora x (100 / 100 utilizzati/mese) x 730 ore in un mese = 76,65 USD (costo del nodo principale EMR)addebiti EC2 = 1 istanza x 0,398 USD all'ora x 730 ore in un mese = 290,54 USD (costo del nodo principale EC2)
Nodi principali:
Spese EMR = 2 istanze x 0,105 USD all'ora x (100/100 utilizzati/mese) x 730 ore in un mese = 153,30 USD (costo del nodo principale EMR)
Spese EC2 = 2 istanze x 0,398 USD all'ora x 730 ore in un mese = 581,08 USD (costo del nodo principale EC2)
Spese totali = 76,65 USD + 290,54 USD + 153,30 USD + 581,08 USD = 1101,57 USD
Esempio 2: EMR su EKS
Prezzo basato sui prezzi della regione Stati Uniti orientali 1.
Supponi di eseguire un'applicazione Amazon EMR-Spark implementata su Amazon EKS. In questo caso, EKS richiama la sua capacità di elaborazione utilizzando istanze EC2 r5.2xlarge (8 vCPU, 64 GB RAM). Supponiamo che il cluster EKS abbia 100 nodi, per un totale di 800 vCPU e 6400 GB di memoria totale. Supponiamo che l'applicazione utilizzi 100 VCPU e 300 GB di memoria per 30 minuti.
Aumento delle spese totali di Amazon EMR per il processo:
Aumento totale sulla vCPU = (100 * 0,01012 USD * 0,5) = (numero di vCPU * per tariffa vCPU/ora * tempo di esecuzione del processo all’ora) = 0,506 USD
Aumento totale sulla memoria = ( 300 * 0,00111125 USD * 0,5) = (quantità di memoria utilizzata * per tariffa GB/ora * tempo di esecuzione del processo all’ora) = 0,1667 USD
Aumento EMR complessivo per il processo EMR = 0,6727 USD
Costi aggiuntivi
Paghi 0,10 USD all'ora per ogni cluster Amazon EKS creato. È possibile utilizzare un singolo cluster Amazon EKS per eseguire più applicazioni, sfruttando gli spazi dei nomi di Kubernetes e i criteri di sicurezza IAM. Puoi eseguire EKS su AWS utilizzando Amazon EC2 o AWS Fargate.
Se utilizzi Amazon EC2 (incluso con gruppi di nodi gestiti Amazon EKS), paghi per le risorse AWS (ad es. istanze EC2 o volumi Amazon EBS) che crei per eseguire i tuoi nodi worker Kubernetes. I prezzi sono calcolati in base all'uso effettivo. Non sono previste tariffe minime né spese anticipate. Vedi informazioni dettagliate sui prezzi alla pagina dei prezzi EC2.
Se utilizzi AWS Fargate, i prezzi vengono calcolati in base alle risorse vCPU e di memoria impiegate dal momento in cui viene avviato il download dell'immagine del container fino al termine del pod di Amazon EKS, arrotondati al secondo più vicino. È prevista una tariffa minima di un minuto. Per informazioni dettagliate sui prezzi, visita la pagina dei prezzi di AWS Fargate.
Esempio 3: EMR Serverless
Supponiamo che tu abbia inviato un lavoro Spark a EMR Serverless. Ipotizziamo che il processo sia configurato per l'impiego di un minimo di 25 dipendenti e un massimo di 75 dipendenti, ognuno configurato per l'utilizzo di 4VCPU e 30 GB di memoria. Non è stata configurata alcuna archiviazione temporanea aggiuntiva. Se il tuo lavoro viene eseguito per 30 minuti impiegando 25 dipendenti (o 100 vCPU) ed è stato dimensionato automaticamente per aggiungere altri 50 dipendenti (200 vCPU in più) per 15 minuti:
Costo complessivo della vCPU/ora = (100 * 0,052624 USD * 0,5) + (200 * 0,052624 USD * 0,25) = (numero di vCPU * per tariffa vCPU/ora * tempo di esecuzione del processo all’ora) = 5,2624 USD
Costo complessivo dei GB/ora = (750 * 0,0057785 USD * 0,5) + (1500 * 0,0057785 USD * 0,25) = (Totale dei GB di memoria configurati * tariffa per GB/ora * tempo di esecuzione del processo all’ora) = 4,333875 USD
Costo complessivo di EMR Serverless = 9,596275 USD
Tariffe aggiuntive: se la tua applicazione utilizza altri servizi AWS come Amazon S3, ti verranno addebitate le tariffe standard previste per S3.
Esempio 4: EMR WAL
Supponiamo di creare un nuovo cluster Amazon EMR con Apache HBase e di aver scelto di eseguire il backup completo del cluster nella regione Stati Uniti orientali (Virginia settentrionale). Essendo un cluster per una nuova applicazione, non conosci i tuoi modelli di traffico. Per semplicità, supporremo che l'utente abbia creato 10 tabelle HBase incluse le tabelle di sistema, 2 Regioni HBase per tabella e che ogni volta che un utente interagisce con l'applicazione, scriva 1 KiB di dati.
Per un periodo di 10 giorni, ricevi poco traffico verso la tua applicazione, con conseguenti 10.000 scritture ogni giorno. Tuttavia, l'undicesimo giorno il traffico dell'applicazione sale a 2.500.000 scritture. Decidi inoltre di aggiornare contemporaneamente il codice personalizzato sul cluster e di effettuare un downtime notturno programmato per gli utenti finali il giorno 11. Supponiamo che ciò si traduca in 1.000.000 di letture dall'EMR WAL per le operazioni di ripristino HBase. L'applicazione si ricalibrerà per offrire agli utenti un'esperienza senza interruzioni. La tua applicazione finirà quindi per avere un traffico più regolare, con 50.000 scritture ogni giorno fino alla fine del mese.
La tabella seguente riepiloga l'utilizzo totale per il mese.
Arco di tempo: (giorno del mese) | Scritture totali | Letture totali | Utilizzo EMR WAL |
1 - 10 | 100.000 scritture (10.000 scritture x 10 giorni) | ||
11 | 2.500.000 di scritture | 1.000.0000 di letture | |
12-30 | 950.000 scritture (50.000 scritture x 19 giorni) | ||
Totale al mese | 3.550.000 di scritture | 1.000.0000 di letture | |
Fattura mensile | 0,30 USD (0,0883 USD per GiB di richieste di scrittura EMR WAL x 3,55 milioni di scritture KiB/1048576 KIB/GiB) | 0,08 USD (0,0883 USD per GiB di richieste di lettura EMR WAL x 1 milione di letture KiB/1048576 KIB/GiB) | 25,92 USD (0,0018 USD per WAL all'ora di utilizzo di EMR WAL X utilizzo di 10 tabelle HBase X 2 Regioni HBase per tabella HBase X 1 WAL per Regione HBase X 30 giorni X 24 ore o utilizzo di 14.400 EMR-WAL-WALHours) |
Per il mese, la fattura sarà di 26,52 USD, un totale che include 0,38 USD per ReadRequestGiB e WriteRequestGiB e 25,92 USD per EMR-WAL-WALHours.
Risorse aggiuntive sui prezzi
Calcola facilmente le spese mensili con AWS
Contatta gli specialisti AWS per ricevere un preventivo personalizzato
Ottieni l'accesso immediato al piano gratuito di AWS.
Inizia subito a utilizzare Amazon EMR nella Console di gestione AWS.