Tarification AWS Lambda

Le coût de la durée est fonction de la quantité de mémoire que vous attribuez à votre fonction. Vous pouvez allouer n'importe quelle quantité de mémoire (entre 128 Mo et 10 240 Mo) à votre fonction, et ceci par tranches de 1 Mo. Le tableau ci-dessous contient quelques exemples du prix par ms associé à différentes tailles de mémoire, pour une utilisation dans les limites du premier niveau de tarification, par exemple jusqu'à 6 milliards de Go-secondes par mois dans la région USA Est (Ohio).

  • Prix x86
  • Prix (Arm)

Les niveaux de tarification de durée à la demande Lambda sont appliquées à la durée mensuelle regroupée des fonctions s'exécutant sur la même architecture (x86 ou Arm, respectivement), dans la même région, au sein du compte. Si vous faites appel à la facturation consolidée dans AWS Organizations, les niveaux de tarification sont appliqués à la durée mensuelle regroupée de vos fonctions s'exécutant sur la même architecture, dans la même région, sur les différents comptes au sein de l'organisation.

Tarification du stockage éphémère Lambda

Le coût du magasin éphémère dépend de la quantité de magasin éphémère que vous allouez à votre fonction et de la durée d’exécution de la fonction, mesurée en millisecondes. Vous pouvez allouer n’importe quelle quantité de stockage supplémentaire à votre fonction entre 512 Mo et 10 240 Mo, par incréments de 1 Mo. Vous pouvez configurer le magasin éphémère pour les fonctions exécutées aussi bien sur les architectures x86 et Arm. 512 Mo de magasin éphémère sont disponibles pour chaque fonction Lambda sans frais supplémentaires. Vous ne payez que pour le magasin éphémère supplémentaire que vous configurez.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

Tarification pour la simultanéité allouée

Vous pouvez activer la simultanéité allouée pour vos fonctions Lambda afin de mieux contrôler les performances de vos applications sans serveur. Lorsqu'elle est activée, la simultanéité allouée conserve les fonctions initialisées et hyperprêtes à réagir en millisecondes à deux chiffres. Vous payez le montant de la simultanéité que vous configurez ainsi que le temps de configuration. Dès que la simultanéité allouée est activée pour votre fonction et que vous l'exécutez, vous payez également pour les requêtes et la durée aux prix indiqués ci-dessous. Si votre fonction dépasse la simultanéité configurée, vous êtes facturé pour l'exécution des fonctions excédentaires aux prix indiqués dans la section Tarification AWS Lambda ci-dessus. Vous pouvez activer la simultanéité allouée pour les fonctions qui s'exécutent sur les architectures x86 et Arm. Pour en savoir plus sur la simultanéité allouée, consultez la documentation.

La simultanéité allouée est calculée entre le moment où vous l'activez sur votre fonction et celui de sa désactivation. Sa valeur est arrondie à 5 minutes près. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction et de la quantité de simultanéité que vous configurez sur celle-ci. La durée est calculée à partir du moment où votre code commence à s'exécuter jusqu'à ce qu'il retourne ou à sa fin ; elle est arrondie à 1 ms près**. Le prix est fonction de la quantité de mémoire que vous attribuez à votre fonction.

** Les frais de durée s'appliquent au code qui s'exécute dans le gestionnaire d'une fonction et au code d'initialisation déclaré en dehors du gestionnaire. Pour les fonctions Lambda avec des extensions AWS Lambda, la durée inclut également la durée nécessaire à la dernière exécution du code pour terminer l'exécution durant la phase d'interruption. Pour les fonctions configurées avec la simultanéité allouée, AWS Lambda recycle périodiquement les environnements d'exécution et réexécute votre code d'initialisation. Pour plus de détails, consultez la documentation Modèle de programmation Lambda.

L'offre gratuite pour Lambda ne concerne pas les fonctions pour lesquelles la simultanéité allouée est activée. Si vous activez la simultanéité allouée pour votre fonction et que vous l'exécutez, vous serez facturé pour les requêtes et la durée sur la base du prix indiqué ci-dessous.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

  • Supposons que vous êtes un développeur d'appli mobile et que vous êtes en train de créer une application mobile de commande de nourriture. Les clients peuvent utiliser l'application pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné vos prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.

    Pour des besoins de simplicité, supposons que votre application traite trois millions de requêtes par mois. La
    durée moyenne d'exécution de la fonction, dans ce cas, est de 120 ms. Votre fonction est configurée avec 1 536 Mo de mémoire et sur un processeur basé sur une architecture x86.

    Vous lancez la nouvelle version de votre application mobile, qui est d'ailleurs fortement commercialisée. Vous prévoyez un pic de la demande, de la période allant de midi à 20 heures, pendant la journée de lancement. Vous souhaitez que votre application mobile réagisse même lorsque la demande augmente et diminue rapidement, ce qui vous permet d'activer la simultanéité allouée sur vos fonctions Lambda. La simultanéité allouée est définie à 100.

    Pendant huit heures, vos fonctions reçoivent 500 000 requêtes. La durée moyenne
    d'exécution de la fonction lorsque la simultanéité allouée est activée est de 100 ms. Pendant le reste du mois, votre application reçoit 2,5 millions de requêtes en plus et vos fonctions s'exécutent en réponse à celles-ci sans que la simultanéité allouée ne soit activée.

    Vos frais seront calculés comme suit :

    Frais pour la simultanéité allouée :
    Le prix de la simultanéité allouée est facturé 0,0000041667 USD par GO
    La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 8 heures x 3 600 secondes = 28 800 secondes
    Total pour la simultanéité configurée (Go) : 100 x 1 536 Mo/1 024 Mo = 150 Go
    Total pour la simultanéité allouée (GO) : 150 Go x 28 800 secondes = 4 320 000 GO
    Frais pour la simultanéité allouée : 4,32 millions de GO x 0,0000041667 USD = 18 USD

    Frais pour les requêtes :
    Le prix de la requête mensuel est de 0,20 USD par million de requêtes et l'offre gratuite fournit un million de requêtes par mois.
    Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
    3 000 000 de requêtes – 1 000 000 de requêtes comprises dans l'offre gratuite = 2 000 000 de requêtes facturables par mois
    Frais mensuels pour les requêtes = 2 x 0,20 USD = 0,40 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est activée :
    Le prix applicable au calcul est de 0,0000097222 USD par GO
    Durée totale du calcul (secondes) = 500 000 x 100 ms = 50 000 secondes
    Durée totale du calcul (GO) = 50 000 secondes x 1 536 Mo/1 024 Mo = 75 000 GO.
    Frais de calcul mensuels = 75 000 GO x 0,0000097222 USD = 0,73 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est désactivée :
    Le prix de calcul mensuel revient à 0,0000166667 USD par GO et l'offre gratuite fournit 400 000 GO.
    Taux de calcul total (en secondes) = 2,5 millions x 120 ms = 300 000 secondes
    Durée totale du calcul (GO) = 300 000 x 1 536 Mo/1 024 Mo = 450 000 GO
    Total pour le calcul – Valeur de l'offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en GO)
    450 000 GO – 400 000 GO (offre gratuite) = 50 000 GO
    Frais de calcul mensuels = 50 000 x 0,0000166667 USD = 0,83 USD

    Frais mensuels totaux :
    Total des frais = Frais de la simultanéité allouée + Frais de la requête + Frais de calcul lorsque la simultanéité allouée est activée + Frais de calcul lorsque la simultanéité allouée est désactivée
    Total des frais = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD

  • Supposons que vous êtes un détaillant qui organise une grande vente pendant le Cyber Monday, un jour férié aux États-Unis, dédié au e-commerce et qui a lieu le lundi qui suit Thanksgiving. Vos clients peuvent échanger en temps réel avec le support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un modèle de traitement du langage naturel (NLP).

    Dans ce cas, vous utilisez le modèle populaire BERT (Bidirectional Encoder Representations from Transformers) disponible dans AWS Lambda. Ce modèle vous aide à analyser et à comprendre les interactions du service client grâce à l'application mobile, de manière à afficher du contenu d'assistance pertinent ou à acheminer le client vers l'agent de service client approprié. Vous recevez des demandes d'assistance client beaucoup plus élevées que d'habitude pendant cette vente. Vous décidez donc d'activer la simultanéité allouée sur vos fonctions Lambda pour que votre application réponde rapidement même en cas de pic de trafic.

    Supposons que vos fonctions reçoivent deux millions de requêtes pendant les 24 heures suivant cette vente et que la simultanéité allouée est activée. Dans ce cas, la durée moyenne d'exécution de la fonction est de 280 ms. Votre fonction est configurée avec 4,096 Mo de mémoire, sur un processeur basé sur x86, et la simultanéité allouée est défini à 7.

    Vos frais seront calculés comme suit :

    Frais pour la simultanéité allouée :
    Le prix de la simultanéité allouée est facturée 0,0000041667 USD par GO.
    La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 24 heures x 3 600 secondes = 86 400 secondes
    Le total de la simultanéité configurée (GO) : 7 x 4 096 Mo/1 024 Mo = 28 GO
    Total pour la simultanéité allouée (GO) = 28 Go x 86 400 secondes = 2 419 200 GO
    Frais pour la simultanéité allouée = 2 419 200 GO x 0,0000041667 USD = 10,08 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est activée :
    Le prix applicable au calcul est de 0,0000097222 USD par GO.
    Durée totale du calcul (secondes) = 2 000 000 x 280 ms = 560 000 secondes
    Durée totale du calcul (GO) = 560 000 secondes x 4 096 Mo/1 024 Mo = 2 240 000 GO.
    Frais de calcul mensuels = 2 240 000 GO x 0,0000097222 USD = 21,78 USD

    Frais de requêtes mensuels :
    Le prix mensuel pour les requêtes est de 0,20 USD par million de requêtes
    Frais de requêtes mensuels = 2 M * 0,2 USD/M = 0,40 USD

    Frais mensuels totaux :
    Frais totaux = Frais de la simultanéité allouée + Frais de calcul lorsque la simultanéité allouée est activée + Frais de la requête = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD

Tarification de SnapStart

SnapStart peut améliorer les performances de start-up de quelques secondes à moins d'une seconde pour les applications sensibles à la latence. SnapStart fonctionne en capturant l'état initialisé de la mémoire (et du disque) de votre fonction et en mettant en cache cet instantané pour un accès à faible latence. Lorsque votre fonction est ensuite invoquée, Lambda reprend les environnements d'exécution à partir de cet instantané pré-initialisé au lieu de les initialiser à partir de zéro, ce qui améliore la latence de start-up.

Un instantané est créé chaque fois que vous publiez une nouvelle version de votre fonction avec SnapStart activé. La mise en cache d'un instantané vous est facturée à la période pendant laquelle la version de votre fonction est active, pendant au moins 3 heures et par milliseconde par la suite. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction. Vous êtes également facturé chaque fois que Lambda reprend un environnement d'exécution en restaurant votre instantané, le prix dépendant de la quantité de mémoire que vous allouez à votre fonction.

La tarification de SnapStart ne s'applique pas aux exécutions gérées par Java prises en charge.

  • Imaginons que vous êtes une entreprise de logistique disposant d'une flotte de véhicules sur le terrain, dont chacun est doté de capteurs et d'une connectivité 4G/5G permettant d'émettre des données télémétriques à l'intérieur d'un flux de données Amazon Kinesis. Vous souhaitez utiliser des modèles de machine learning (ML) que vous avez développé pour inférer l'état du véhicule et prédire à quel moment une maintenance d'un composant en particulier est nécessaire.

    Supposons que vous possédez 10 000 véhicules sur le terrain et que chacun émette des données télémétriques une fois par heure de manière échelonnée avec suffisamment de gigue. Vous envisagez d'effectuer cette inférence sur chaque charge utile pour vous assurer que les véhicules sont immédiatement programmés pour la maintenance et ainsi garantir un état optimal de votre flotte de véhicules.

    Supposons que le modèle ML comprend la fonction et que sa taille est de 512 Mo. Pour l'inférence, votre fonction est configurée avec 1 Go de mémoire et son exécution facturée prend deux secondes en moyenne sur un processeur basé sur x86. Vous gérez une version unique de votre fonction. Pour simplifier, supposons que 1 % de toutes les requêtes aboutissent à la création de nouveaux environnements d'exécution.

    Vous remarquez que le traitement de bout en bout prend plusieurs secondes pour ces 1 % de demandes. Cela est dû au fait que l'initialisation de votre fonction prend plusieurs secondes, car vous importez des modules logiciels volumineux et le modèle de machine learning lors de l'initialisation. Vous souhaitez réduire le temps de traitement de bout en bout de ces demandes. Vous devez donc activer SnapStart sur votre fonction et publier une nouvelle version.

    Vos frais seront calculés comme suit :

    Frais pour les requêtes
    La fonction Lambda traite chaque mois 10 000 x 24 x 31 = 7 440 000 messages émis par les véhicules.

    Frais de requêtes mensuels : 7,44 M x 0,20 USD/M = 1,49 USD

    Frais de calcul mensuels
    Votre fonction sera exécutée une fois par message toutes les deux secondes, et ce, une fois par mois.

    Durée mensuelle du calcul (secondes) : 7,44 millions x 2 secondes = 14,88 millions de secondes
    Calcul mensuel (Go/s) : 14,88 millions de secondes x 1024 Mo/1024 Mo = 14,88 millions de Go/s
    Frais mensuels pour le calcul : 14,88 millions de Go/s x 0,0000166667 USD = 248,00 USD

    Frais de SnapStart :

    Durée totale pendant laquelle la version de la fonction est active (secondes) : 24 heures x 31 jours x 3600 secondes = 2 678 400 secondes
    Mémoire de fonction allouée : 1024 Mo/1024 Mo -> 1 Go
    Cache SnapStart utilisé au total : 1 Go x 2 678 400 s -> 2 678 400 Go/s
    Frais de cache SnapStart : 2,68 millions de Go/s x 0,0000015046 USD = 4,03 USD

    Nombre de requêtes utilisant SnapStart Restore : 1 % de 7,44 millions = 74 400
    Restauration SnapStart totale utilisée : 74 400 x 1 Go = 74 400 Go
    Frais de restauration de SnapStart : 74 400 Go x 0,0001397998 USD = 10,4 USD

    Frais totaux de SnapStart : frais de cache de SnapStart + frais de restauration de SnapStart
    Frais totaux de SnapStart : 4,03 USD + 10,4 USD = 14,43 USD

    Frais mensuels totaux

    Frais totaux = Frais de requête + Frais de calcul + Frais de SnapStart
    Total des frais = 1,49 USD + 248,00 USD + 14,43 USD = 263,92 USD

Tarification du flux de réponse HTTP Lambda

Les fonctions AWS Lambda peuvent renvoyer un flux de réponse HTTP lorsqu'elles sont invoquées via l'API InvokeWithResponseStream ou via une URL de fonction à l'aide du mode d'appel ResponseStream. Le streaming de réponses HTTP peut améliorer les performances du délai d'obtention du premier octet et prend en charge des charges utiles supérieures à 6 Mo. Lorsque vous utilisez le streaming de réponses HTTP, vous êtes facturé pour chaque Go écrit dans le flux de réponse par votre fonction. Vous pouvez diffuser gratuitement les 6 premiers Mo à la demande.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

Tarification du mode provisionné pour le mappage des sources d’événements (ESM)

Le mode provisionné pour le mappage des sources d’événements (ESM) vous permet d’optimiser le débit de votre ESM en allouant un nombre minimum et maximum de ressources nommées interrogateurs d’événements, et en effectuant une mise à l’échelle automatique entre les limites minimale et maximale configurées. Cette fonctionnalité est idéale pour les applications axées événements en temps réel qui enregistrent des pics de trafic soudains. Un interrogateur d’événements est la ressource configurable qui sous‑tend un ESM en mode provisionné, il fournit un débit allant jusqu’à 5 Mo/s. La tarification est basée sur le nombre minimum d’interrogateurs d’événements provisionnés et sur ceux consommés lors de la mise à l’échelle automatique. Les frais sont calculés à l’aide d’une unité de facturation nommée unité d’interrogateur d’événements (EPU). Chaque EPU prend en charge jusqu’à 20 Mo/s de débit pour l’interrogation d’événements, et le nombre d’interrogateurs d’événements alloués à une EPU dépend du débit consommé par chaque interrogateur d’événements. Les frais sont calculés en fonction du nombre et de la durée des EPU utilisées, en heure d’unité d’interrogateur d’événements (h‑EPU).

Transfert de données : les frais sont facturés conformément aux frais de transfert de données AWS standards.

Durée : la tarification est calculée à la seconde, avec un minimum d’une minute.

  • Exemple : analyse de données de streaming en temps réel avec Kafka

    Supposons que vous soyez un fournisseur mondial de solutions de centre de contact client et que vous disposiez de pipelines qui transmettent des métadonnées relatives à l’expérience d’appel vers des rubriques Amazon MSK (Kafka) à des fins d’analyse en temps réel. Étant donné que le trafic peut connaître des pics et être imprévisible, vous souhaitez utiliser le mode provisionné pour ESM afin d’optimiser les performances de votre ESM. Supposons que votre fonction Lambda qui traite ces messages soit configurée avec 1 024 Mo de mémoire pour un processeur x86 et doive gérer un million d’invocations par jour d’une durée moyenne de deux secondes. Supposons également que vous ayez activé le mode provisionné pour votre ESM avec l’option par défaut d’un unique interrogateur d’événements, et que votre ESM augmente verticalement jusqu’à consommer 800 h‑EPU par mois dans la région USA Est (Virginie du Nord).

    Frais de calcul mensuels
    La tarification de calcul mensuel est de 0,0000166667 USD par Go/s, et l’offre gratuite fournit 400 000 Go/s
    Calcul total (secondes) = 1 000 000 * 30 * 2 secondes = 60 000 000 secondes
    Calcul total (Go/s) = 60 000 000 * 1 024 Mo/1024 = 60 000 000 Go/s
    Calcul total – Valeur de l’offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en Go/s)
    60 000 000 Go/s – 400 000 Go/s offerts = 59 600 000 Go/s
    Frais de calcul mensuels = 59 600 000 * 0,0000166667 USD = 993,3 USD

    Frais de requêtes mensuels
    Le tarif mensuel pour les requêtes correspond à 0,20 USD par million de requêtes.
    Frais mensuels de requêtes = 60 millions de requêtes * 0,20 USD = 12,00 USD

    Frais mensuels du mode provisionné pour ESM
    Frais EPU = 800 h‑EPU * 0,185 USD = 148 USD
    Frais mensuels du mode provisionné pour ESM = 148 USD

    Total des frais
    Total des frais = Frais de calcul + Frais de requêtes + Frais du mode provisionné pour ESM
    Total des frais = 993,3 USD + 12 USD + 148 USD = 1 153,3 USD

     

Transfert de données et frais divers

Transfert de données
Les données transférées « à l'intérieur » et « à l'extérieur » de vos fonctions AWS Lambda, depuis l'extérieur de la région où elles ont été exécutées, sont facturées aux débits de transfert de données Amazon EC2 indiqués ici sous « Transfert de données ».

Le transfert de données avec les fonctions AWS Lambda est gratuit dans la même région AWS entre les services suivants : Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) et Amazon SimpleDB.

L'utilisation d'Amazon Virtual Private Cloud (VPC) ou de l'appairage de VPC, avec les fonctions AWS Lambda, entraîne des frais supplémentaires tel qu'expliqué sur la page relative à la tarification à la demande d'Amazon Elastic Compute Cloud (EC2). Une connexion d'appairage de VPC est une connexion de mise en réseau entre deux VPC qui permet d'acheminer le trafic entre ces derniers à l'aide d'adresses IPv4 ou IPv6 privées

Frais supplémentaires
Des frais supplémentaires peuvent vous être facturés si votre fonction Lambda nécessite l'utilisation d'autres services AWS ou des transferts de données. Par exemple, si votre fonction Lambda lit des données depuis Amazon S3, ou écrit des données dans Amazon S3, les demandes de lecture/écriture et les données stockées dans Amazon S3 vous seront facturées.

Pour plus de détails sur la tarification des services AWS, consultez la section Tarification de chaque service AWS concerné.

Tarification Lambda@Edge

La durée des fonctions Lambda@Edge est mesurée avec une granularité de 1 ms

Ressources de tarification supplémentaires

Calculateur de tarification AWS

Calculez facilement vos coûts mensuels avec AWS

Obtenir de l'aide pour la tarification

Contacter les spécialistes AWS pour obtenir un devis personnalisé