Le Blog Amazon Web Services
10 visualisations à essayer dans Amazon QuickSight
Cet article est un bon point de départ pour la construction de visualisations facilitant l’accès rapide à des indicateurs de performance métier à l’aide d’Amazon QuickSight. Dans cet article, nous passons en revue quelques scénarios courants avec des jeux de données pour vous donner un aperçu de la manière dont vous pouvez connecter vos données, effectuer des analyses avancées et accéder aux résultats à partir de n’importe quel navigateur web ou appareil mobile.
Les visualisations sont construites à partir de jeux de données publics disponibles, dont les liens sont fournis ci-après. Avant de commencer, examinons les sources de données supportées, les formats de fichiers et un workflow typique de QuickSight pour construire une visualisation de données.
Quelles sont les sources de données prises en charge par Amazon QuickSight ?
Vous pouvez utiliser les méthodes d’accès aux données suivantes :
- Se connecter aux sources de données d’AWS, y compris :
- Télécharger des feuilles de calcul Excel ou des fichiers plats (CSV, TSV, CLF et ELF)
- Se connecter à des bases de données on-premises telles que Teradata, SQL Server, MariaDB, MySQL, PostgreSQL et Oracle
- Importer des données à partir d’applications SaaS tel que Salesforce et Snowflake
- Utiliser des moteurs de traitement Big Data tel que Apache Spark et Presto
Cette liste ne cesse de s’étendre. Pour plus d’information, vous pouvez consulter la liste des sources de données prises en charge.
Des réponses instantanées
SPICE est le moteur de calcul en mémoire parallèle d’Amazon QuickSight, conçu spécifiquement pour la visualisation de données ad hoc. SPICE stocke vos données dans un système conçu pour une haute disponibilité, où elles sont sauvegardées jusqu’à ce que vous choisissiez de les supprimer. Vous pouvez ainsi améliorer les performances des jeux de données en les important dans SPICE au lieu d’interroger directement la base de données. Pour calculer la capacité SPICE dont votre jeu de données a besoin, consulter le guide de Gestion de la capacité SPICE.
Workflow typique pour Amazon QuickSight
À l’aide d’Amazon QuickSight, vous pouvez accéder aux données et les préparer en vue de leur utilisation dans un rapport. Il enregistre vos données préparées soit en mémoire SPICE, soit en tant que requête directe. Vous pouvez utiliser diverses sources de données pour l’analyse. Lorsque vous créez une analyse, le flux de travail classique se présente sous la forme suivante :
- Créez une analyse;
- Ajouter des jeux de données nouveaux ou existants;
- Choisissez des champs pour créer le premier graphique. QuickSight suggère automatiquement la meilleure visualisation;
- Ajoutez d’autres graphiques, tableaux ou informations à l’analyse. Redimensionnez et réorganisez-les sur une ou plusieurs feuilles. Utilisez des fonctionnalités étendues pour ajouter des variables, des contrôles personnalisés, des couleurs, des pages supplémentaires (appelées feuilles), etc;
- Publiez l’analyse sous la forme d’un tableau de bord pour la partager avec d’autres personnes.
L’illustration suivante illustre le workflow de base.
Visualisations créées dans Amazon QuickSight avec des exemples de jeux de données
Visualisations pour un analyste de données
Source : https://data.worldbank.org/
Téléchargement et ressources : https://datacatalog.worldbank.org/dataset/world-development-indicators
Catalogue de données : La Banque mondiale investit dans de multiples projets de développement aux niveaux national, régional et mondial. C’est une excellente source d’information pour les analystes de données.
Le graphique suivant montre le pourcentage de la population ayant accès à l’électricité (rurale et urbaine) pour l’année 2000 en Asie, en Afrique, au Moyen-Orient et en Amérique latine.
Le graphique suivant montre la part des coûts des soins de santé qui sont payés de sa propre poche (privé vs. public). Vous pouvez également naviguer sur le graphique pour obtenir un aperçu des statistiques détaillées.
Visualisations pour un analyste de trading
Source : Jeu de données publique de Deutsche Börse (DBG PDS)
Téléchargement et ressources : https://aws.amazon.com/public-datasets/deutsche-boerse-pds/
Catalogue de données : Le projet DBG PDS met gratuitement à la disposition du public des données en temps réel issues des systèmes de marché de la Deutsche Börse. C’est la première fois que des données aussi détaillées sur les marchés financiers sont partagées librement et de manière continue par le fournisseur de la donnée.
Le graphique suivant montre la tendance du marché en ce qui concerne le volume maximal des échanges pour différentes banques de l’UE. Il s’appuie sur les données disponibles sur les moteurs XETRA, qui sont constitués d’une variété d’actions, de fonds et de titres dérivés. Vous pouvez faire défiler ce graphique afin de visualiser les échanges sur une période d’une heure ou plus.
Le graphique suivant montre les actions ordinaires surpassant le reste du volume maximum d’échanges sur une période donnée, regroupées par type de titres.
Visualisations pour un spécialiste des données
Source : https://catalog.data.gov/
Téléchargement et ressources : https://catalog.data.gov/dataset/road-weather-information-stations
Catalogue de données : Les données provenant de différentes stations de capteurs placées sur les ponts et les rues de villes américaines constituent une source d’information essentielle. La station d’information météorologique routière dispose d’un capteur de température qui mesure la température du revêtement de la rue. Elle dispose également d’un capteur qui mesure la température de l’air ambiant au niveau de la station.
Le graphique suivant montre la température maximale actuelle de l’air à Seattle à partir des différents capteurs de la station RWI (Road Weather Information, en anglais).
Le graphique suivant montre la température minimale du revêtement de la route à différents moments, ce qui permet de prévoir les conditions de la route à un moment particulier de l’année.
Visualisations pour un data engineer
Source : https://www.kaggle.com/
Téléchargement et ressources : https://www.kaggle.com/datasnaek/youtube-new/data
Catalogue de données : Kaggle est une plateforme participative où des entreprises peuvent proposer des problèmes en data science ainsi que les jeux de données associés. Les data engineers et les autres membres de la communauté disposent d’un libre accès à ces jeux de données et peuvent contribuer au mouvement de données publiques. Plus de 350 jeux de données au total sont disponible au moment de la publication, dont plus de 200 en tant que jeux de données vedettes. La plateforme comporte de nombreux jeux de données intéressants qui ne sont pas présents ailleurs, et c’est une plateforme qui permet de collaborer et partager avec d’autres passionnés de données.
Le graphique suivant montre les tendances des vidéos YouTube et présente la répartition des 20 chaînes ayant le plus grand nombre de vidéos préférées. C’est l’un des jeux de données les plus populaires auprès des data engineers.
Le graphique suivant montre les statistiques quotidiennes du nombre maximum par visionnages de titres vidéo publiés pendant une période donnée.
Visualisations pour un utilisateur professionnel
Source : Données sur les taxis de New York
Téléchargement et ressources : https://data.cityofnewyork.us/Transportation/2016-Green-Taxi-Trip-Data/hvrh-b6nb
Catalogue de données : NYC OpenData héberge plusieurs jeux de données publics très populaires pour tous les New-Yorkais. Cette plate-forme vous permet de vous plonger dans les données pour en tirer des visualisations utiles. Le jeu de données sur les courses de taxis verts de 2016 comprend les enregistrements de toutes les courses effectuées dans des taxis verts à New York. Les enregistrements comprennent des champs capturant les dates et heures de prise en charge et de dépose, les lieux de prise en charge et de dépose, les distances parcourues, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers déclarés par le chauffeur.
Le graphique suivant présente le montant maximum de la course regroupé par le nombre de passagers pendant une période de temps au cours d’une journée. Il peut être étendu à d’autres jours du mois en fonction des besoins de l’entreprise.
Le graphique suivant présente les données sur les taxis de New York à partir de Janvier 2016, montrant une baisse du nombre de taxis pris le 23 janvier 2016, tous types de taxis confondus.
Une recherche rapide pour cette date et ce lieu vous permet d’obtenir l’information suivante :
Conclusion
Grâce à Amazon QuickSight, vous pouvez observer des tendances à travers une série de données temporelles en construisant des visualisations, en effectuant des analyses ad hoc et en générant rapidement des aperçus. Nous espérons que vous l’essaierez dès aujourd’hui !
Si vous avez trouvé cet article utile, n’hésitez pas à consulter également l’article Amazon QuickSight Adds Support for Combo Charts and Row-Level Security, qui vous présente plus de fonctionnalités pour construire vos dashboards personnalisés.
Article original contribué par Karthik Odapally et Pranabesh Mandal, Architectes de Solutions spécialisés dans l’analytique, et adapté en français par Weibo GU, Architecte de Solutions dans les équipes AWS France.