Tarifs d'Amazon Bedrock

Vue d'ensemble des tarifs

Amazon Bedrock est un service entièrement géré qui propose un choix de modèles de fondation (FM) performants via une API unique, ainsi qu’un large éventail de capacités permettant de créer des applications d’IA génératives alliant sécurité, confidentialité et IA responsable.

Avec Amazon Bedrock, l’inférence et la personnalisation des modèles vous sont facturées. Vous avez le choix entre deux plans tarifaires pour l’inférence : 1. À la demande et par lots : ce plan vous permet d’utiliser les FM sur la base du paiement à l’utilisation sans avoir à prendre d’engagements temporels. 2. Débit alloué : ce plan vous permet d’allouer un débit suffisant pour répondre aux exigences de performances de votre application en échange d’un engagement à durée déterminée.

Modèles de tarification

À la demande

Avec le mode à la demande, vous ne payez que ce que vous consommez, sans engagement de durée. Pour les modèles de génération de texte, vous êtes facturé pour chaque jeton d’entrée traité et chaque jeton de sortie généré. Pour les modèles d’intégration, vous êtes facturé pour chaque jeton d’entrée traité. Un jeton est composé de quelques caractères et se réfère à l’unité de base du texte qu’un modèle apprend pour comprendre la saisie et l’invite de l’utilisateur. Pour les modèles de génération d’images, vous êtes facturé pour chaque image générée.

Lot

Avec le mode par lots, vous pouvez fournir un ensemble d’invites dans un seul fichier d’entrée et recevoir les réponses dans un seul fichier de sortie, ce qui vous permet d’obtenir des prédictions simultanées à grande échelle. Les réponses sont traitées et stockées dans votre compartiment Amazon S3 afin que vous puissiez y accéder ultérieurement. La tarification du mode par lots est la même que celle du mode à la demande.

Débit alloué

Avec le mode de débit provisionné, vous pouvez acheter des unités de modèle pour un modèle de base ou un modèle personnalisé spécifique. Le mode de débit provisionné est principalement conçu pour les charges de travail d’inférence cohérentes importantes qui nécessitent un débit garanti. Les modèles personnalisés ne sont accessibles qu’à l’aide du débit provisionné. Une unité modèle fournit un certain débit, qui est mesuré par le nombre maximum de jetons d’entrée ou de sortie traités par minute. Avec la tarification du débit provisionné, vous êtes facturé à l’heure, vous avez la possibilité de choisir entre des conditions d’engagement d’un mois ou de six mois.

Personnalisation du modèle

Avec Amazon Bedrock, vous pouvez personnaliser les FM en fonction de vos données afin de fournir des réponses adaptées à des tâches spécifiques et à votre contexte commercial. Vous pouvez affiner les modèles à l’aide de données étiquetées ou utiliser un pré-entraînement continu avec des données non étiquetées. Pour la personnalisation d’un modèle de génération de texte, vous êtes facturé pour l’entraînement du modèle en fonction du nombre total de jetons traités par le modèle (nombre de jetons dans le corpus de données d’entraînement multiplié par le nombre d’époques) et pour le stockage du modèle facturé par mois et par modèle. Une époque correspond à un passage complet dans votre jeu de données d’entraînement lors d’un ajustement ou d’un pré-entraînement continu. Les inférences utilisant des modèles personnalisés sont facturées dans le cadre du plan de débit provisionné et nécessitent que vous achetiez le débit provisionné. Une unité de modèle est mise à disposition sans engagement de durée pour l’inférence sur un modèle personnalisé. Vous serez facturé pour le nombre d'heures que vous utilisez dans la première unité du modèle pour l'inférence de modèle personnalisé. Si vous souhaitez augmenter votre débit au-delà d’une unité de modèle, vous devez souscrire un engagement d’un mois ou de six mois.

Évaluation du modèle

Avec l'évaluation des modèles sur Amazon Bedrock, vous payez en fonction de ce que vous utilisez, sans engagement de volume de demandes et de réponses. Pour l'évaluation automatique, vous ne payez que pour l'inférence à partir du modèle que vous avez choisi lors de l'évaluation. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Dans le cas d'une évaluation basée sur l'humain où vous apportez votre propre équipe de travail, l'inférence du modèle lors de l'évaluation vous est facturée à 0,21 USD par tâche humaine effectuée. Une tâche humaine est définie comme une instance dans laquelle un travailleur humain soumet une évaluation d'une seule invite et de ses réponses d'inférence associées dans l'interface utilisateur d'évaluation humaine. Le prix est le même que vous utilisiez un ou deux modèles pour votre travail d'évaluation et quel que soit le nombre de mesures d'évaluation et de méthodes de notation que vous incluez. Les frais liés aux tâches humaines apparaîtront dans la section Amazon SageMaker de votre facture AWS et sont les mêmes pour toutes les régions AWS. Il n'y a pas de frais distincts pour la main-d'œuvre, car c’est vous qui la fournissez. Pour une évaluation par un expert gérée par AWS, la tarification est personnalisée en fonction de vos besoins d'évaluation dans le cadre d'un engagement privé en collaboration avec l'équipe d'évaluation d'AWS.

Des outils puissants pour créer sans frais supplémentaires

Lorsque vous utilisez des agents pour Amazon Bedrock et des bases de connaissances pour Amazon Bedrock, vous n’êtes facturé que pour les modèles et les bases de données vectorielles que vous utilisez avec ces capacités.

Ventilation de la tarification

La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.

AI21 Labs

Tarification à la demande et par lots

Modèles AI21 Labs Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic 2 Ultra

0,0188 USD

0,0188 USD

Amazon

Région

Anthropic

Tarification à la demande et par lots

Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Claude 3 Opus*

0,015 USD

0,075 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

*Claude 3 Opus est actuellement disponible dans la région USA Ouest (Oregon)

Région : Asie-Pacifique (Mumbai)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Région : Asie-Pacifique (Sydney)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Région : Europe (Paris)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Région : Asie-Pacifique (Tokyo)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Région : Europe (Francfort)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Tarification du débit alloué

Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Anthropic Prix par heure par modèle avec
aucun engagement
Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

44,00 USD

39,60 USD

22 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Modèles Anthropic Prix par heure par modèle avec
aucun engagement
Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

44,00 USD

39,60 USD

22 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Région : Asie-Pacifique (Tokyo)

Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

53 USD

29 USD

Claude 2.0/2.1

86 USD

48 USD

Région : Europe (Francfort)

Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

49 USD

27 USD

Claude 2.0/2.1

79 USD

44 USD

Contactez l’équipe responsable de votre compte AWS pour plus de détails sur les unités modèles. 

Cohere

Tarification à la demande et par lots

Modèles Cohere Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie
Command 0,0015 USD 0,002 USD
Command-Light 0,0003 USD 0,0006 USD
Command R+ 0,0030 USD 0,0150 USD
Command R 0,0005 USD 0,0015 USD
Embed – anglais 0,0001 USD N/A
Embed – multilingue 0,0001 USD N/A

Tarification pour la personnalisation (ajustement)

Modèles Cohere Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé par mois Prix à déduire d’un modèle personnalisé par unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

Command de Cohere

0,004 USD

1,95 USD

49,5 USD

Command-Light de Cohere 0,001 USD

1,95 USD

8,56 USD

*Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement multipliés par le nombre d’époques

Tarification du débit provisionné

Modèles Cohere Prix par heure et par modèle 
sans engagement
Tarif horaire par unité modèle pour un engagement d'un mois

Tarif horaire par unité modèle pour un engagement de six mois

Command de Cohere

49,5 USD

39,60 USD

23,77 USD

Cohere Command - Light 8,56 USD

6,85 USD

4,11 USD
Embed – anglais 7,12 USD

6,76 USD

6,41 USD
Embed – multilingue 7,12 USD

6,76 USD

6,41 USD

Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles. 

Meta Llama

Llama 3

Tarification à la demande et par lots 

Région

Llama 2

Tarification à la demande et par lots 

Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Meta Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Lama 2 Chat (13B)

0,00075 USD

0,001 USD

Llama 2 Chat (70B)

0,00195 USD

0,00256 USD

Tarification pour la personnalisation de modèle (ajustement)

Modèles Meta Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé* par mois Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

Llama 2 Pretrained (13B)

0,00149 USD

1,95 USD

23,50 USD

Llama 2 Pretrained (70B)

0,00799 USD

1,95 USD 23,5 USD

*Stockage de modèles personnalisés = 1,95 USD

Tarification du débit provisionné

Modèles Meta Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité de modèle pour un engagement de six mois

Llama 2 Pretrained et Chat (13B)

21,18 USD

13,08 USD

Llama 2 Pretrained (70B)

21,18 USD

13,08 USD

*Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.

Pour plus de détails sur les unités de modèle, veuillez contacter l’équipe responsable de votre compte AWS ou l’équipe des ventes.

Mistral AI

Région

Stability AI

Tarification à la demande et par lots

Les modèles d’image proposés par Stability AI sont facturés par image, en fonction du nombre d’étapes et de la résolution de l’image

Modèle Stability AI Résolution de l’image Prix par image générée pour la qualité standard (<=50 étapes) Prix par image générée pour la qualité supérieure (>50 étapes)

 

SDXL 0.8

512 × 512 ou plus petit

0,018 USD par image

0,036 USD par image

Plus grand que 512 × 512

0,036 USD par image

0,072 USD par image

SDXL 1.0

Jusqu’à 1024 × 1024

0,04 USD 0,08 USD

Tarification du débit provisionné

Modèle Stability AI Tarif horaire par unité modèle pour un engagement d’un mois* Tarif horaire par unité modèle pour un engagement de six mois*

SDXL 1.0

49,86 USD

46,18 USD

**Comprend l’inférence pour les modèles de base et les modèles personnalisés

Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.

Actuellement, la personnalisation des modèles (ajustement) n’est pas prise en charge pour les modèles Stability AI sur Amazon Bedrock.

Barrières de protections pour Amazon Bedrock

Tarification à la demande

Politique en matière de barrières de protections * Prix pour 1 000 unités de texte**

Filtres de contenu

0,75 USD

Sujets refusés

1 USD

Filtre d'informations sensibles (PII)

0,10 USD

Filtre d'informations sensibles (expression régulière)  Gratuit
Filtres de mots

Gratuit

* Chaque politique de barrière de protections est facultative et peut être activée en fonction des exigences de votre application. Des frais seront facturés en fonction du type de police utilisé pour la barrière de protections. Par exemple, si une barrière de protections est configurée avec des filtres de contenu et des sujets refusés, des frais seront facturés pour ces deux politiques, alors qu'aucun frais ne sera associé aux filtres d'informations sensibles.

**Une unité de texte peut contenir jusqu'à 1 000 caractères. Si une saisie de texte comporte plus de 1 000 caractères, elle est traitée comme plusieurs unités de texte, chacune contenant 1 000 caractères ou moins. Par exemple, si une saisie de texte contient 5 600 caractères, elle sera facturée pour 6 unités de texte.


Les barrières de protections ne sont pas prises en charge pour les images et les intégrations.

Exemples de tarification

  • Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Amazon Titan Text Lite pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base Amazon Titan Image Generator pour générer 1 000 images de taille 1 024 × 1 024 au format de qualité standard.

    Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD

    Tarification de la personnalisation (ajustement et pré-entraînement continu)

    Un développeur d’applications personnalise un modèle Amazon Titan Image Generator à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer la performance du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot, + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD

    Tarification du débit provisionné

    Un développeur d’applications achète deux unités de modèles Amazon Titan Text Express avec un engagement d'un mois pour son cas d'utilisation de résumé de texte.

    Coût mensuel total encouru = 2 unités de modèles x 18,40 USD/heure x 24 heures x 31 jours = 27 379,20 USD

    Un développeur d’applications achète une unité de modèle du modèle de base Amazon Titan Image Generator avec un engagement d’un mois.

    Coût total engagé = 1 unité modèle x 16,20 USD x 24 heures x 31 jours = 12 052,80 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Anthropic Claude pour résumer une entrée de 11 000 jetons de texte d’entrée en une sortie de 4 000 jetons.

    Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle Anthropic Claude Instant dans la région USA Ouest (Oregon) :

    Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,0020 USD = 0,013 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command - Light pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Embed anglais ou multilingue pour générer des intégrations pour 10 000 jetons d’entrée.

    Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise un modèle Cohere Command à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,50 USD) = 55,45 USD

    Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 39,60 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de Cohere Command avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Meta Llama 2 Chat (13B) pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.

    Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise le modèle Llama 2 Pretrained (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,50 USD) = 33,44 USD

    Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 21,18 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 21,18 USD x 24 heures x 31 jours = 15 757,92 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD

    Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons. 

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,008 USD + 1 000 jetons/1 000 x 0,024 USD = 0,04 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille d’étape de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.1.0 pour générer une image de 1 024 x 1 024 avec une taille d’étape de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD

    Tarification du débit provisionné

    Un développeur d’applications achète une unité de modèle de SDXL 1.0 avec un engagement d’un mois.

    Coût total = 1 x 49,86 USD x 24 heures x 31 jours = 37 095,84 USD

  • Exemple d'évaluation du modèle 1 :

    Tarification à la demande
    Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).

    Le jeu de données contient 50 invites, et le développeur a besoin d’un travailleur pour évaluer chaque ensemble invite-réponse (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »).

    Cette tâche d'évaluation comportera 50 tâches (1 tâche pour chaque paire d’invite-réponse par travailleur). Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

    Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Exemple d'évaluation du modèle 2 :

    Tarification à la demande
    Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).

    Le jeu de données contient 50 invites, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble invites-réponses (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »). Ce travail d'évaluation comportera 100 tâches (1 tâche pour chaque ensemble invites-réponses par travailleur : 2 travailleurs x 50 ensembles invites-réponses = 100 tâches humaines).

    Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

    Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Exemple 1 : chatbot d'assistance à la clientèle
    Un développeur d'applications crée un chatbot d'assistance à la clientèle et utilise des filtres de contenu pour bloquer le contenu préjudiciable et les sujets refusés pour filtrer les requêtes et les réponses indésirables.

    Le chatbot répond à 1 000 requêtes d'utilisateurs par heure. Chaque requête utilisateur a une longueur d'entrée moyenne de 200 caractères et reçoit une réponse FM de 1 500 caractères.

    Chaque requête utilisateur de 200 caractères correspond à une unité de texte.

    Chaque réponse FM de 1 500 caractères correspond à 2 unités de texte.

    Unités de texte traitées chaque heure = (1 + 2) x 1 000 requêtes = 3 000 unités de texte

    Coût total par heure pour les filtres de contenu et les sujets refusés = 3 000 x (0,75 USD + 1,00 USD) / 1 000 = 5,25 USD

     

    Exemple 2 : résumé des transcriptions d’un centre d'appels
    Un développeur d'applications crée une application pour résumer les transcriptions des discussions entre les utilisateurs et les agents d’assistance. Il utilise un filtre d'informations sensibles pour supprimer les données d’identification personnelles (PII) dans les résumés générés pour 10 000 conversations.

    Chaque résumé généré comporte en moyenne 3 500 caractères, ce qui correspond à 4 unités de texte.

    Coût total engagé pour résumer 10 000 conversations = 10 000 x 4 x (0,1 / 1 000 USD) = 4 USD

    Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total
    Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tâches humaines             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD