Amazon-Athena-Funktionen

Warum Athena?

Amazon Athena ist ein interaktiver Abfrageservice, der die Analyse von Daten in direkt in Amazon S3 mit Standard-SQL erleichtert. Athena ist Serverless, sodass keine Infrastruktur eingerichtet oder verwaltet werden muss. Sie können wählen, ob Sie auf der Grundlage der von Ihnen ausgeführten Abfragen oder der für Ihre Abfragen benötigten Rechenleistung bezahlen möchten. Sie können Athena nutzen, um Protokolle zu verarbeiten, Datenanalysen durchzuführen und interaktive Abfragen auszuführen. Athena skaliert sich automatisch. Mehrere Abfragen werden parallel ausgeführt, sodass Sie die Ergebnisse selbst bei großen Datensätzen und komplexen Abfragen schnell zurück erhalten.  

Page Topics

Wichtigste Vorteile

Wichtigste Vorteile

Amazon Athena ist ein serverloser Service. Deshalb muss keine Infrastruktur verwaltet werden. Sie brauchen sich keine Gedanken über die Konfiguration, über Softwareupdates, Fehler oder die Skalierung Ihrer Infrastruktur zu machen, selbst wenn Ihre Datensätze und die Anzahl Ihrer Benutzer wachsen. Athena kümmert sich automatisch um diese Dinge, sodass Sie sich ganz auf die Daten, nicht auf die Infrastruktur, konzentrieren können.

Für Athena brauchen Sie sich lediglich bei der Athena-Konsole anzumelden, Ihr Schema im Konsolenassistenten oder mittels DDL-Anweisungen zu definieren und schon können Sie Ihre Abfrage mit dem integrierten Abfrageeditor starten. Sie können mit AWS Glue auch automatisch Datenquellen nach Daten durchsuchen und Ihren Datenkatalog mit neuen und geänderten Tabellen- und Partitionsdefinitionen füllen. Die Ergebnisse werden innerhalb von Sekunden auf der Konsole angezeigt und automatisch an einen Ort Ihrer Wahl in S3 geschrieben. Sie können die Ergebnisse auch auf Ihren Desktop herunterladen. Bei Athena müssen Sie Ihre Daten nicht mit komplexen ETL-Aufträgen für die Analyse vorbereiten. Dadurch kann jeder mit SQL-Kenntnissen schnell große Datensätze analysieren.

Amazon Athena basiert auf Trino und Presto, verteilten Open-Source-SQL-Engines, die für interaktive Datenanalysen mit geringer Latenz optimiert sind. Daher können Sie in Amazon S3 auch Abfragen an großen Datensätzen mit ANSI SQL und Support für große Joins, Fensterfunktionen und Arrays ausführen. Athena unterstützt zahlreiche Datenformate wie CSV, JSON, ORC, Avro und Parquet. Mit Athenas Verbund-Datenquellen-Connectors können Sie zusätzliche Datenspeicher abfragen und die Daten mit den in Amazon S3 gespeicherten Daten verbinden. Über die JDBC- und ODBC-Treiber von Athena können Sie auf Athena zugreifen und Abfragen von der Athena-Konsole, der API, der CLI, dem AWS-SDK und den unterstützten Business-Intelligence- und SQL-Entwicklungsanwendungen ausführen.

Amazon Athena bietet zwei flexible Preismodelle. Standardmäßig werden Abfragen auf der Grundlage der pro Abfrage gescannten Daten in Terabytes (TB) abgerechnet. Auf diese Weise können Sie Abfragen einreichen, ohne die Berechnung im Voraus planen zu müssen. Wenn Sie es vorziehen, auf der Grundlage der Rechenleistung zu zahlen, die Ihre Abfragen verbrauchen, oder wenn Sie die Nebenläufigkeit steuren und Workloads priorisieren möchten, verwenden Sie die kapazitätsbasierte Preisgestaltung, die mit Provisioned Capacity verfügbar ist. Für zusätzliche Flexibilität können Sie die Abrechnung pro Abfrage und die kapazitätsabhängige Preisgestaltung gleichzeitig für dasselbe Konto verwenden.

Bei Amazon Athena brauchen Sie sich keine Gedanken über die Verwaltung oder Optimierung von Clustern zu machen, um die Leistung zu steigern. Athena ist für eine hohe Performance mit Amazon S3 optimiert. Athena führt Abfragen automatisch parallel aus. Ihre Abfrageergebnisse erhalten Sie daher auch bei großen Datensätzen binnen Sekunden.  

Amazon Athena ist hochverfügbar und führt Abfragen mithilfe der Rechenressourcen verschiedener Standorte aus. Sollte ein Standort nicht erreichbar sein, werden die Abfragen automatisch an den nächstgelegenen Standort weitergeleitet. Athena verwendet Amazon S3 als zu Grunde liegenden Datenspeicher und macht ihre Daten hoch verfügbar und dauerhaft. Amazon S3 bietet eine beständige Infrastruktur zum Speichern wichtiger Daten und ist für eine Beständigkeit von 99,999999999 % der Objekte konzipiert. Ihre Daten werden redundant an mehreren Standorten und auf mehreren Geräten an jedem Standort gespeichert.

Amazon Athena ermöglicht Ihnen die Steuerung des Datenzugriffs mithilfe von AWS Identity and Access Management-Richtlinien (IAM), Zugriffskontrolllisten (ACLs) und Amazon S3-Bucketrichtlinien. Mit IAM-Richtlinien können Sie IAM-Benutzern eine differenzierte Kontrolle über Ihre S3-Buckets gewähren. Durch die Kontrolle des Zugriffs auf Daten in S3 können Sie die Abfrage der Daten durch Benutzer mithilfe von Athena einschränken. Zudem ermöglicht Ihnen Athena die unkomplizierte Abfrage der in Amazon S3 gespeicherten verschlüsselten Daten und das Zurückschreiben der verschlüsselten Ergebnisse in Ihren S3-Bucket. Sowohl die serverseitige Verschlüsselung als auch die clientseitige Verschlüsselung werden unterstützt.

Amazon Athena ist für die Nutzung mit AWS Glue vorkonfiguriert. Mit dem Datenkatalog von AWS Glue können Sie ein einheitliches Metadaten-Repository für verschiedene Services erstellen, Datenquellen nach Datem durchsuchen, den Katalog mit neuen und geänderten Tabellen- und Partitionsdefinitionen füllen und die Schemaversionierung aufrechterhalten. Die vollständig verwalteten ETL-Funktionen von Glue ermöglichen es Ihnen darüber hinaus, Daten zu transformieren oder in Spaltenformate zu konvertieren, um die die Leistung zu steigern und die Kosten zu senken. Weitere Informationen zu AWS Glue.

Athena bietet integrierte Konnektoren zu mehr als 30 beliebten AWS-, On-Premises- und anderen Cloud-Datenspeichern, darunter Amazon Redshift, Amazon DynamoDB, Google BigQuery, Google Cloud Storage, Azure Synapse, Azure Data Lake Storage, Redis, Snowflake und SAP Hana. Durch die Verwendung von Athena-Datenquellenkonnektoren können Sie mithilfe der Athena-SQL-Syntax Erkenntnisse aus mehreren Datenquellen generieren, ohne Ihre Daten verschieben oder transformieren zu müssen. Daten-Connectors werden als AWS-Lambda-Funktionen ausgeführt und können für den kontoübergreifenden Zugriff aktiviert werden, um SQL-Abfragen für Hunderte von Endbenutzern zu skalieren. Eine vollständige Liste der unterstützten Datenquellen finden Sie unter Verfügbare Datenquellenkonnektoren. Informationen zum Erstellen eines benutzerdefinierten Datenquellenkonnektors finden Sie im Athena Connector SDK.

Sie können Ihre SageMaker-Machine-Learning-Modelle zur Ausführung von Inferenz in einer Athena-SQL-Abfrage aufrufen. Die Möglichkeit, ML-Modelle in SQL-Abfragen zu verwenden, macht komplexe Aufgaben wie die Anomalieerkennung, Kundenkohortenanalyse und Verkaufsprognosen so einfach wie das Schreiben einer SQL-Abfrage. Athena erleichtert allen Nutzern mit SQL-Erfahrung die Ausführung von ML-Modellen, die in Amazon SageMaker bereitgestellt werden.