Prezzi di Amazon Bedrock
Panoramica dei prezzi
Amazon Bedrock è un servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni attraverso una singola API, insieme a un'ampia gamma di funzionalità necessarie per creare applicazioni di IA generativa garantendo sicurezza, privacy e IA responsabile.
Amazon Bedrock prevede l'addebito dei costi relativi all'inferenza e alla personalizzazione dei modelli. È possibile scegliere tra due piani tariffari per inferenza: 1. On demand e batch: questa modalità consente di utilizzare gli FM con pagamento in base al consumo senza vincoli temporali. 2. Throughput assegnato: questa modalità consente di eseguire il provisioning di un throughput sufficiente per soddisfare i requisiti prestazionali dell'applicazione in cambio di un vincolo temporale.
Modelli di prezzo
Strumenti avanzati
Dettagli sui prezzi
Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.
Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di intelligenza artificiale come Anthropic, Meta, Mistral AI e Amazon per l'inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Fai riferimento all'elenco dei modelli qui.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Importazione di modelli personalizzati
-
AI21 Labs
-
AI21 Labs
Prezzi on-demand
Modelli AI21 Labs Prezzo per 1.000 token di input Prezzo per 1.000 token di output Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic 2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Prezzi su richiesta e in batch
Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Haiku
0,001 USD
0,005 USD
0,0005 USD
0,0025 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 2.0
0,008 USD
0,024 USD
N/D
N/D
Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
*Claude 3 Opus è al momento disponibile solo nella regione degli Stati Uniti occidentali (Oregon) **I prezzi di Claude 3.5 Sonnet si applicano a tutte le versioni di Claude 3.5 Sonnet (v1 e v2) - Claude 3.5 Sonnet v2 è attualmente disponibile nella regione Stati Uniti occidentali (Oregon) Regione: Europa (Londra)
Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Regione: Europa (Zurigo)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Sud America (San Paolo)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Canada (Centrale)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Asia Pacifico (Mumbai)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Asia Pacifico (Sydney)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Asia Pacifico (Tokyo)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
Claude 2.0/2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Regione: Asia Pacifico (Singapore)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Regione: Europa (Parigi)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Regione: Europa (Francoforte)
Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude Instant
0,0008 USD
0,0024 USD
N/D
N/D
Claude 2.0/2.1
0,008 USD
0,024 USD
N/D
N/D
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Regione: Asia Pacifico (Seoul)
Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/D
N/D
Regione: Stati Uniti orientali (Ohio)
Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/D
N/D
Claude 3 Haiku
0,00025 USD
0,00125 USD
N/D
N/D
Prezzi del throughput assegnato
Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Modelli antropici Prezzo orario per modello con
nessun impegnoPrezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Modelli antropici Prezzo orario per modello con
nessun impegnoPrezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Regione: Asia Pacifico (Tokyo)
Modelli antropici Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Regione: Europa (Francoforte)
Modelli antropici Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Contatta il team del tuo account AWS per maggiori dettagli sulle unità modello.
-
Cohere
-
Cohere
Prezzi on-demand
Modelli Cohere Prezzo per 1.000 token di input Prezzo per 1.000 token di output Command 0,0015 USD 0,0020 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Integrato - Inglese 0,0001 USD N/D Integrato - Multilingue 0,0001 USD N/D Prezzi per la personalizzazione (messa a punto)
Modelli Cohere Prezzo per addestrare 1.000 gettoni Prezzo mensile per memorizzare ogni modello personalizzato Prezzo da dedurre da un modello personalizzato per unità di modello all'ora (con prezzi Provisioned Throughput senza impegno) Cohere Command
0,004 USD
1,95 USD
49,50 USD
Command-Light Cohere 0,001 USD 1,95 USD
8,56 USD *Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoche
Prezzi del throughput fornito
Modelli Cohere Prezzo orario per modello
senza impegnoPrezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command - Light 8,56 USD 6,85 USD
4,11 USD Integrato - Inglese 7,12 USD 6,76 USD
6,41 USD Integrato - Multilingue 7,12 USD 6,76 USD
6,41 USD Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
-
Meta Llama
-
Meta Llama
Llama 3.2
Prezzi on demand e in batch
Llama 3.1
Prezzi su richiesta e in batch
Prezzi per la personalizzazione del modello (fine-tuning)
Prezzi del throughput assegnato
Llama 3
Prezzi on demand
Llama 2
Prezzi on demand
Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Meta modelli Prezzo per 1.000 token di input Prezzo per 1.000 token di output Chat Llama 2 (13B)
0,00075 USD
0,001 USD
Chat Llama 2 (70B) 0,00195 USD
0,00256 USD Prezzi per la personalizzazione del modello (messa a punto)
Meta modelli Prezzo per addestrare 1.000 gettoni Prezzo per l'archiviazione di ogni modello personalizzato* al mese Prezzo da dedurre da un modello personalizzato per 1 unità modello all'ora (con prezzi del throughput assegnato senza impegno) Llama 2 Preaddestrato (13B)
0,00149 USD
1,95 USD
23,50 USD
Llama 2 Preaddestrato (70B) 0,00799 USD
1,95 USD 23,50 USD *Archiviazione per modelli personalizzati = 1,95 USD
Prezzi del throughput fornito
Meta modelli Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi Llama 2 Preaddestrato e Chat (13B)
21,18 USD
13,08 USD
Llama 2 Preaddestrato (70B) 21,18 USD
13,08 USD *I modelli preaddestrati di Llama 2 sono disponibili solo in provisioned throughput previa personalizzazione.
Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Prezzi on demand
Modello Stability AI Prezzo per immagine generata Stable Image Core 0,04 USD SD3 Large 0,08 USD Stable Image Ultra 0,14 USD La precedente generazione dei modelli di immagine offerti da Stability AI ha un prezzo per immagine, che dipende dal numero di passaggi e dalla risoluzione dell'immagine.
Modello Stability AI Risoluzione dell'immagine Prezzo per immagine generata per una qualità standard (<=50 passaggi) Prezzo per immagine generata per una qualità premium (>50 passaggi) SDXL 1,0 Fino a 1024 x 1024 0,04 USD 0,08 USD Prezzi del throughput fornito
Modello Stability AI Prezzo orario per unità modello con impegno di 1 mese* Prezzo orario per unità modello per un impegno di 6 mesi* SDXL 1,0
49,86 USD
46,18 USD
*Include l'inferenza per i modelli base e personalizzati
Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
Attualmente, la personalizzazione del modello (messa a punto) non è supportata per i modelli Stability AI su Amazon Bedrock.
-
Importazione di modelli personalizzati
-
Importazione di modelli personalizzati
-
Llama
-
Lama multimodale
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Versione unità di modello personalizzate v1.0 Prezzo per unità di modello personalizzate al min* 0,0785 USD Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate. *Fatturato in intervalli da 5 minuti -
Lama multimodale
-
Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Versione unità di modello personalizzate v1.0 Prezzo per unità di modello personalizzate al min* 0,0785 USD Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Llama 3.2 11B 128K richiede 4 unità di modello personalizzate. *Fatturato in intervalli da 5 minuti -
Mistral
-
Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Versione unità di modello personalizzate v1.0 Prezzo per unità di modello personalizzate al min* 0,0785 USD Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Mistral 7B 32K richiede 1 unità di modello personalizzata. *Fatturato in intervalli da 5 minuti -
Mixtral
-
Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Versione unità di modello personalizzate v1.0 Prezzo per unità di modello personalizzate al min* 0,0785 USD Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Mixtral 8x7B 32K richiede 4 unità di modello personalizzate. *Fatturato in intervalli da 5 minuti -
Flan
-
Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)
Versione unità di modello personalizzate v1.0 Prezzo per unità di modello personalizzate al min* 0,0785 USD Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Flan-T5 XL 512 richiede 1 unità di modello personalizzata. *Fatturato in intervalli da 5 minuti
Prezzi di inferenza on demand:
La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l'architettura, le ottimizzazioni dell'inferenza e viene determinato durante il flusso di lavoro di importazione del modello.Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l'alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell'avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per modello importato che è possibile aumentare tramite Service Quotas.
-
Strumenti avanzati per la determinazione dei prezzi (dettagli)
-
Flussi
-
Guardrail
-
Valutazione del modello
-
Flussi
-
Amazon Bedrock Flows
I costi addebitati dipendono dal numero di transizioni di nodo completate necessarie per eseguire un'applicazione. Bedrock Flows conta una transizione di nodo ogni volta che viene eseguito un nodo nel flusso di lavoro. Il costo viene calcolato in base al numero totale di transizioni di nodo per tutti i flussi.
Tutti gli addebiti vengono contabilizzati giornalmente e fatturati mensilmente a partire dal 1° febbraio 2025.
Prezzo per 1.000 transizioni di nodo 0,035 USD Costi aggiuntivi
Potranno essere addebitati costi aggiuntivi se l'esecuzione del flusso di lavoro dell'applicazione prevede l'utilizzo di altri servizi AWS o di trasferimento dei dati. Ad esempio, se il flusso di lavoro invoca una policy Amazon Bedrock Guardrail, verrà fatturato il numero di unità di testo elaborate dalla policy.
-
Guardrail
-
Guardrail di Amazon Bedrock
Politica guardrail*
Prezzo per 1.000 unità di testo**
Filtri per i contenuti
0,75 USD
Argomenti negati
1 USD
Verifica contestuale di base***
0,1 USD
Filtro per informazioni sensibili (PII)
0,1 USD
Filtro per informazioni sensibili (espressione regolare)
Gratis
Filtri per parola
Gratis
Prezzi on demand
* Ogni politica guardrail è opzionale e può essere abilitata in base ai requisiti dell'applicazione. Gli addebiti avverranno in base al tipo di polizza utilizzata nel guardrail. Ad esempio, se un guardrail è configurato con filtri di contenuto e argomenti negati, verranno addebitati costi per queste due politiche, mentre non ci saranno addebiti associati ai filtri di informazioni sensibili.
**Un'unità di testo può contenere fino a 1.000 caratteri. Se un input di testo è superiore a 1.000 caratteri, viene elaborato come più unità di testo, ciascuna contenente 1.000 caratteri o meno. Ad esempio, se un input di testo contiene 5.600 caratteri, verranno addebitate 6 unità di testo.*** La verifica contestuale di base utilizza una fonte di riferimento e una query per determinare se la risposta del modello è fondata sulla fonte e pertinente alla query. Il numero totale di unità di testo addebitate viene calcolato combinando tutti i caratteri della risposta di origine, della query e del modello.
I guardrail non sono supportati per immagini ed embedding.
-
Valutazione del modello
-
Valutazione del modello
La valutazione del modello viene addebitata per l'inferenza del modello scelto. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione su base umana, in cui l'utente porta il proprio flusso di lavoro, viene addebitato il costo dell'inferenza del modello nella valutazione e un costo di 0,21 USD per ogni attività umana completata.
Modello
Prezzo di 1.000 token di input
Prezzo di 1.000 token di output
Prezzo per attività umana
Modello selezionato per la valutazione
In base al modello selezionato
In base al modello selezionato
0,21 USD
Esempi di prezzo
-
AI21 Labs
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 10.000 token/1.000 x 0,0125 USD + 2.000 token/1.000 x 0,0125 USD = 0,15 USD
-
Amazon
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 x 0,0003 USD + 1.000 token/1.000 x 0,0004 USD = 0,001 USD.
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base di Amazon Titan Image Generator per generare 1.000 immagini di dimensione 1024 x 1024 di qualità standard.
Costo totale sostenuto = 1.000 immagini x 0,01 USD per immagine = 10 USD
Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)
Uno sviluppatore di applicazioni personalizza un modello Amazon Titan Image Generator utilizzando 1.000 coppie immagine-testo. Dopo l'addestramento, lo sviluppatore utilizza il throughput fornito dal modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (durata dell'impegno di 1 mese) per ospitare il modello personalizzato.
Il costo mensile sostenuto per l'ottimizzazione è: formazione sull'ottimizzazione (0,005 USD x 500 x 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Prezzi del throughput fornito
Uno sviluppatore di applicazioni acquista due unità di modello di Amazon Titan Text Express con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 2 unità di modello x 18,40 USD/ora x 24 ore x 31 giorni = 27.379,20 USD
Uno sviluppatore di applicazioni acquista un'unità di modello del modello Amazon Titan Image Generator base con un vincolo di 1 mese.
Costo totale sostenuto = 1 unità modello x 16,20 USD x 24 ore x 31 giorni = 12.052,80 USD
-
Anthropic
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.
Costo totale sostenuto= 11.000 token/1.000 x 0,008 USD + 4.000 token/1.000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Prezzi del throughput fornito
Uno sviluppatore di applicazioni acquista un'unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):
Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
-
Cohere
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 6.000 token/1.000 x 0,0015 USD + 2.000 token/1.000 x 0,0020 USD = 0,013 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 6.000 token/1.000 x 0,0003 USD + 2.000 token/1.000 x 0,0006 USD = 0,003 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.
Costo totale sostenuto = 10.000 token/1.000 x 0,0001 USD = 0,001 USD
Prezzi per la personalizzazione (ottimizzazione)
Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.
Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,004 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD
Costo mensile sostenuto per il throughput previsto (impegno di 1 mese) del modello personalizzato = 39,60 USD
Prezzi del throughput fornito
Uno sviluppatore di applicazioni acquista un'unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
-
Meta Llama
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.
Costo totale sostenuto = 2.000 token/1.000 x 0,00075 USD + 500 token/1.000 x 0,001 USD = 0,002 USD
Prezzi per la personalizzazione (ottimizzazione)
Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.
Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,00799 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD
Costo mensile sostenuto per il throughput fornito (impegno di 1 mese) del modello personalizzato = 21,18 USD
Prezzi del throughput fornito
Uno sviluppatore di applicazioni acquista un'unità di modello di Meta Llama 2 con un impegno di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 1 unità di modello x 21,18 USD x 24 ore x 31 giorni = 15.757,92 USD
-
Mistral AI
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 x 0,00015 USD + 1.000 token/1.000 x 0,0002 USD = 0,0005 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 x 0,00045 USD + 1.000 token/1.000 x 0,0007 USD = 0,0016 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral Large per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 x 0,008 USD + 1.000 token/1.000 x 0,024 USD = 0,04 USD
-
Stability AI
Prezzi su richiesta
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un'immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente).
Costo totale sostenuto = 1 immagine x 0,036 USD per immagine = 0,036 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL1.0 per generare un'immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente).
Costo totale sostenuto = 1 immagine x 0,08 USD per immagine = 0,08 USD
Prezzi del throughput fornito
Uno sviluppatore di applicazioni acquista un'unità di modello di SDXL1.0 con un impegno di 1 mese.
Costo totale sostenuto = 1 x 49,86 USD x 24 ore x 31 giorni = 37.095,84 USD
-
Valutazione di modelli
Esempio di valutazione del modello 1:
Prezzi on demand
Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).Il set di dati contiene 50 prompt e lo sviluppatore richiede 1 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt").
Ci saranno 50 attività in questo processo di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker). I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.
Per questo lavoro di valutazione del modello sono previsti i seguenti costi:Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale Inferenza istantanea di Claude 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Inferenza Claude 2.1 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD 0,52 USD Attività umane 50 0,21 USD 10,50 USD 10,50 USD Totale 11,06 USD Esempio di valutazione del modello 2:
Prezzi on demand
Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).
Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt"). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker: 2 worker x 50 set di risposta rapida = 100 attività umane).
I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.
Per questo lavoro di valutazione del modello sono previsti i seguenti costi:
Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale Inferenza istantanea di Claude 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Inferenza Claude 2.1 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD 0,52 USD Attività umane 100 0,21 USD 21,00 USD 21,00 USD Totale 21,56 USD -
Guardrail di Amazon Bedrock
Esempio 1: chatbot per l'assistenza clienti
Uno sviluppatore di applicazioni crea un chatbot per l'assistenza clienti e utilizza i filtri dei contenuti per bloccare i contenuti dannosi e gli argomenti negati per filtrare domande e risposte indesiderate.
Il chatbot risponde a 1.000 richieste di utenti all'ora. Ogni richiesta utente ha una lunghezza media di input di 200 caratteri e riceve una risposta FM di 1.500 caratteri.
Ogni richiesta utente di 200 caratteri corrisponde a 1 unità di testo.
Ogni risposta FM di 1.500 caratteri corrisponde a 2 unità di testo.
Unità di testo elaborate ogni ora = (1 + 2) x 1.000 interrogazioni = 3.000 unità di testo
Costo totale sostenuto all'ora per i filtri dei contenuti e l'argomento negato = 3.000 x (0,75 USD + 1,00 USD)/1.000 = 5,25 USDEsempio 2: riepilogo della trascrizione del call center
Uno sviluppatore di applicazioni crea un'applicazione per riepilogare le trascrizioni delle chat tra utenti e agenti dell'assistenza. Utilizza un filtro per informazioni sensibili per oscurare le informazioni di identificazione personale (PII) nei riepiloghi generati per 10.000 conversazioni.
Ogni riepilogo generato ha una media di 3.500 caratteri che corrispondono a 4 unità di testo.
Costo totale sostenuto per riassumere 10.000 conversazioni = 10.000 x 4 x (0,1/1.000 USD) = 4 USDElemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale Inferenza istantanea di Claude 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Inferenza Claude 2.1 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD 0,52 USD Attività umane 100 0,21 USD 21,00 USD 21,00 USD Totale 21,56 USD -
Importazione di modelli personalizzati
Esempio di prezzo: uno sviluppatore di applicazioni importa un modello di tipo Llama 3.1 personalizzato con una dimensione di 8B di parametri con una lunghezza di sequenza di 128K nella regione us-east-1 ed elimina il modello dopo 1 mese. Ciò richiede 2 unità di modello personalizzate. Il prezzo al minuto sarà, quindi, di 0,1570 USD perché sono necessarie 2 unità di modello personalizzate. I costi di archiviazione del modello per 2 unità di modello personalizzate sono 3,90 USD al mese.
L'importazione del modello è gratuita. La prima invocazione riuscita è alle 08:03, momento in cui inizia la misurazione. Le finestre di misurazione di 5 minuti sono dalle 08:03 alle 08:07; dalle 08:07 alle 08:11 e così via. Se viene effettuata almeno un'invocazione durante un periodo di 5 minuti, la finestra sarà considerata attiva per la fatturazione. Se non viene effettuata alcuna invocazione dalle 08:07 alle 08:11, la misurazione si interromperà alle 08:11. In questo caso, la fattura verrebbe calcolata come segue: 0,1570 USD × 5 minuti × 3 intervalli da cinque minuti = 2,355 USD.
-
Flussi
Esempio: riepilogo delle notizie
Uno sviluppatore di applicazioni crea un flusso per automatizzare il riepilogo delle notizie per i trader. Il flusso include un nodo di input che contiene una serie di 10 posizioni S3 per gli articoli delle 10 principali agenzie di stampa (1 transizione di nodo). Quindi utilizza un nodo iteratore per scorrere le 10 posizioni, recuperare il file da ciascuna posizione S3 utilizzando il nodo di recupero S3 e invocare un modello con un nodo prompt per riepilogare ogni file (+ 10 file x 3 transizioni di nodo). Inoltre, raccoglie tutti i risultati utilizzando un nodo di raccolta, scrive i risultati su S3 utilizzando il nodo di archiviazione S3 e completa in quello di output (+ 3 transizioni di nodo). Eseguono questo flusso ogni mezz'ora di ogni giorno della settimana.
Il numero di transizioni di nodo per esecuzione di flusso è: 1 + 10 × 3 + 3 = 34 transizioni di nodo per esecuzione del flusso
Il numero di esecuzioni di flusso al mese è: 24 ore × 2 × 5 giorni × 4 settimane = 960 esecuzioni di flusso al mese.
La fattura mensile totale è: 34 × 960 × 0,035/1000 USD = 1,14 USDCosti aggiuntivi
La fattura includerà anche costi aggiuntivi per i servizi AWS utilizzati nell'esecuzione del flusso di lavoro, inclusi gli utilizzi di Amazon S3 nei nodi di recupero e archiviazione e l'utilizzo del modello di fondazione Amazon Bedrock nel nodo prompt.