Finden und beheben Sie Probleme effizient, verbessern Sie den Zustand von Anwendungen und das Kundenerlebnis.

Drei grundlegende Signale für die Beobachtbarkeit sind Metriken, Protokolle (halbstrukturierte Daten) und Traces (Abläufe von Anfragen von Anfang bis Ende über alle Abhängigkeiten hinweg). Diese Signale sind die Ausgabe von überwachten Umgebungen, wie Containern, Microservices und Anwendungen. Ziel ist es, DevOps und Site Reliability Engineers ein integriertes Erlebnis zu bieten, um kritische Ereignisse zu isolieren und alle Beobachtungssignale zu nutzen, um Probleme bei containerisierten Anwendungen und Microservices, die überall laufen, zu isolieren. Amazon OpenSearch Service kombiniert die Analyse von Protokoll- und Trace-Daten in einer einzigen Lösung.

Einführung in die Beobachtbarkeit mit Amazon OpenSearch Service in AWS On Air (21:19)

Beobachtbarkeitsoperationen

Amazon OpenSearch Service bietet neue Funktionen, die Ihnen bei der Lösung Ihrer Beobachtungsprobleme helfen. Verwenden Sie offene Schnittstellen zum Erfassen, Weiterleiten und Umwandeln von Telemetriedaten (einschließlich OpenTelemetry, Fluent Bit, Fluent Bit, Logstash, Data Prepper, und mehr). Sie können große Mengen an halbstrukturierten Daten mit nativen Funktionen durchsuchen und analysieren. Sie können mit den Beobachtungsfunktionen von OpenSearch Dashboards zur Erkennung von Anomalien visualisieren, überwachen und warnen und mit der Piped Processing Language (PPL), einer Abfrageoberfläche, interaktive Analysen und Visualisierungen von Daten durchführen.

Amazon OpenSearch Service geht das Problem der Beobachtbarkeit, der Ablaufverfolgungsanalyse, der Protokollanalyse und der Überwachung der Anwendungsleistung (APM) über vier Dimensionen an:

Erfassen: Zunächst müssen Sie Daten zur Analyse erfassen. Die Erfassung umfasst das Sammeln, Anreichern, Filtern, Transformieren und Normalisieren von Daten aus verschiedenen Quellen.

Erkennen: Oftmals bemerken Kunden Probleme nicht so schnell, wie sie begonnen haben. Es gibt oft eine Verzögerung zwischen dem Beginn eines Problems und dem Zeitpunkt, an dem Sie benachrichtigt werden. Sie möchten dies so weit wie möglich reduzieren. Die Erkennung sollte proaktiv und vielschichtig sein (z. B. Alarme über Telemetrie). Die Erkennung von Anomalien ist ein wichtiges Instrument, ebenso wie die Möglichkeit, zusammenhängende Alarme miteinander zu verknüpfen, um die Alarmmüdigkeit zu verringern. Eine Kernkomponente der Erkennung ist auch die Visualisierung und Überwachung, die Amazon OpenSearch Service mit einer Komponente namens OpenSearch-Dashboards übernimmt. Sie können die Daten sogar interaktiv analysieren mit Tools wie PPL.

Untersuchen: Die meiste Zeit während eines operativen Ereignisses verbringen die Mitarbeiter mit Untersuchen – und für die Untersuchungen sind in der Regel mehrere Personen erforderlich. Dies ist der größte Beitrag zu Mean Time to Incident (MTTI) und Mean Time to Recovery (MTTR). Das Chaos zu durchschauen und zu verstehen, worauf man sich konzentrieren sollte, bleibt eine schwierige Aufgabe. Verwenden Sie Protokolle, Metriken und Tracing, um schnell eine Ursachenanalyse durchzuführen und dabei Metriken, Protokolle und Traces miteinander zu korrelieren – auf AWS, vor Ort oder in anderen Clouds. Arbeiten Sie gemeinsam an den Untersuchungen und dokumentieren Sie Ihre Analyse mit OpenSearch-Dashboard-Notebooks. 

Beheben: Nachdem Sie die Ursache eines Fehlers ermittelt haben, müssen Sie ihn beheben. Es gibt nichts Schlimmeres, als zu versuchen, etwas zu reparieren und die Situation noch schlimmer zu machen. Vergessen Sie nicht, eine Analyse nach dem Ereignis durchzuführen, um festzustellen, wie Sie den Ausfall von vornherein hätten verhindern können. Dokumentieren Sie die vorgeschlagenen Änderungen, damit Sie verhindern können, dass das Problem erneut auftritt. Ihr Ziel sollte es sein, sicherzustellen, dass das gleiche Problem nie wieder auftritt – und falls doch, dass Sie es automatisch erkennen und beheben können.

Funktionsweise: OpenSearch Service

Funktionsweise – OpenSearch Service

Für die Protokollanalyse gibt es mehrere Aufgaben, um eine sogenannte Ingest-Pipe (Datenaufnahmepipeline) zu erstellen. Produzenten sind Backend-Server, AWS-Services, Webserver und mehr - einschließlich OpenTelemetry, AWS Distro for OpenTelemetry, Jaeger und Zipkin. Erfasser übertragen die Daten von der Quelle und wandeln sie möglicherweise lokal um. Für native AWS-Services können Sie Amazon Kinesis Agent oder Amazon CloudWatch Agent verwenden. Für Open Source sind die gängigen Erfasser Elastic Beats, Fluentd, Fluentbit oder OpenTelemetry Collector. Aggregatoren puffern Informationen von den Erfassern, was die Gesamtanzahl der Verbindungen zum Amazon OpenSearch Service erheblich reduziert. Amazon OpenSearch Service indiziert und analysiert dann das Ergebnis der Aggregatoren. Um die Ergebnisse zu visualisieren und zu überwachen, können Sie OpenSearch Dashboards oder Kibana verwenden.

Überwachung der Anwendungsleistung

Manchmal ist Application Performance Monitoring (APM) die erste Reifegradstufe der Beobachtbarkeit. Aber APM allein reicht nicht aus. Läuft Ihre Anwendung tatsächlich wie erwartet, auch wenn Ihr Anwendungsüberwachungs-Dashboard alles im grünen Bereich zeigt? Bekommen Ihre Kunden das Benutzererlebnis, das sie brauchen? Wie wird Ihre Anwendung genutzt? Welche Teile Ihrer Anwendung stoßen an die Grenzen der Skalierbarkeit? In welcher geografischen Region verzeichnen Sie das größte Wachstum? Welche Trends können Sie visualisieren und dafür vorausplanen? Wenn Sie Metriken erfassen könnten, hätten Sie die Gewissheit, dass Sie bei der Implementierung von neuem Code oder bei Änderungen an Ihrer Infrastruktur die Auswirkungen dieser Änderungen erkennen können. Durch die Beobachtbarkeit wird APM weiterentwickelt, um diese zusätzlichen Fragen zu beantworten.

Kunden

Chase International: Ständig verfügbares Kundenerlebnis in großem Maßstab
Dow Jones und 3M: Beobachtbarkeit mit Amazon OpenSearch Service

Beobachtbarkeitsressourcen

Blogs und Dokumentation

„Was gibt es Neues?“-Beitrag


Neue Benutzeroberfläche zur Beobachtbarkeit und Protokollanalyse

Amazon OpenSearch Service enthält jetzt eine Beobachtbarkeitsbenutzeroberfläche und Protokollüberwachungsfunktionen, die Entwicklern und DevOps-Ingenieuren die Erkenntnisse liefern, die sie benötigen, um Leistungsprobleme schneller zu diagnostizieren und Anwendungsausfallzeiten zu reduzieren.

AWS Big Data-Blog


Erste Schritte mit Trace-Analysen

Entwickler und IT-Betriebsteams können diese Funktion nutzen, um Probleme mit der Leistung und Verfügbarkeit ihrer verteilten Anwendungen zu beheben.

AWS-Dokumentation


Trace Analytics für Amazon OpenSearch Service

Erfahren Sie, wie Sie Trace Analytics, das Teil des OpenSearch Observability-Plugins ist, zur Analyse von Trace-Daten aus verteilten Anwendungen verwenden können.

Beobachtbarkeit – Anwendungsfall


Was ist Beobachtbarkeit?

Erfahren Sie, wie Sie Trace Analytics, das Teil des OpenSearch-Beobachtbarkeits-Plugins ist, zur Analyse von Trace-Daten aus verteilten Anwendungen verwenden können.

Artikel zur Beobachtbarkeit


Mehr als Effizienz: Überwindung digitaler Komplexität durch Beobachtbarkeit

Unternehmen versuchen, die Systemleistung zu optimieren, verpassen aber die Gelegenheit zur Umsetzung. In diesem Bericht erfahren Sie, wie Unternehmen Beobachtbarkeitspraktiken integrieren können, um ihre Effizienz zu steigern, Einblicke in Sicherheitsbedrohungen zu geben und den Ruf ihrer Marke zu stärken.

Workshops

Die Beobachtbarkeitsfunktion von Amazon OpenSearch Service ermöglicht es Ihnen, über die einfache Überwachung hinauszugehen und nicht nur zu verstehen, welche Ereignisse stattfinden, sondern auch, warum sie stattfinden. In diesem Workshop lernen Sie, wie Sie Metriken, Traces und Protokolldaten von Benutzer-Frontends bis hin zu Service-Backends und allem, was dazwischen liegt, instrumentieren, erfassen und analysieren können. Kombinieren Sie das mit Amazon OpenSearch Service, AWS Distro for OpenTelemetry, FluentBit und Data Prepper.

AWS-Referenzarchitektur-Diagramm

Beobachtbarkeit mit Protokollen, Ablaufverfolgungen und Metriken

Weitere Informationen »

Videos

Sichern der Zuverlässigkeit und Betriebsbereitschaft mit Beobachtbarkeitslösungen
Einführung in die Beobachtbarkeit mit Amazon OpenSearch Service

Podcasts

Häufig gestellte Fragen

F: Was ist Trace Analytics?
Trace Analytics ist eine neue Funktion von Amazon OpenSearch Service, die es Entwicklern und IT-Betreibern ermöglicht, Leistungsprobleme in verteilten Anwendungen zu finden und zu beheben, was zu schnellerer Problemlösung führt. Trace Analytics basiert auf OpenTelemetry, einem Projekt der Cloud Native Computing Foundation (CNCF), das einen einheitlichen Satz von APIs, Bibliotheken, Agents und Collector-Services zur Erfassung verteilter Traces und Metriken bereitstellt, sodass Kunden Trace Analytics nutzen können, ohne ihre Anwendungen neu instrumentieren zu müssen. Trace Analytics wird von OpenSearch unterstützt, ist Open-Source und frei für jedermann zum Download und zur Nutzung verfügbar.

F: Warum sollte ich Trace Analytics nutzen?
Entwickler und IT Ops benötigen Trace Analytics, um Leistungsprobleme in ihren verteilten Anwendungen zu finden und zu beheben. Durch das Hinzufügen von Trace-Daten zu den vorhandenen Protokollanalysefunktionen von Amazon OpenSearch Service können Kunden ein und denselben Service nutzen, um sowohl die Quelle von Leistungsproblemen zu isolieren als auch deren Ursache zu ermitteln. Darüber hinaus unterstützt Trace Analytics durch die Unterstützung des OpenTelemetry-Standards die Integration mit den Jaeger- und Zipkin-SDKs, zwei beliebten Open-Source-Systemen für verteiltes Tracing, was es Entwicklern ermöglicht, diese SDKs weiterhin zu verwenden und ihre Anwendungen nicht neu instrumentieren zu müssen.

F: Wie verhält sich Trace Analytics zu/arbeitet mit Amazon OpenSearch Service?
Trace Analytics ist eine integrierte Funktion des Amazon OpenSearch Service. Sie ist für alle Kunden ohne Aufpreis verfügbar. Trace Analytics verfügt über eine OpenSearch- und Kibana-basierte Benutzeroberfläche zur Visualisierung und Erkundung von Trace-Daten und ist in wichtige Funktionen von Amazon OpenSearch Service integriert, z. B. Anomalieerkennung, Warnungsgenerierung, detaillierte Zugriffskontrolle und Unternehmenssicherheit. Trace Analytics ergänzt die Nutzung von Amazon OpenSearch Service durch Kunden für die Suche und Analyse von Protokolldaten bei der Lösung von Anwendungsleistungsproblemen.

F: Welche Datenquellen werden von Trace Analytics unterstützt?
Trace Analytics unterstützt die Erfassung von Nachverfolgungs-Daten aus Anwendungsbibliotheken und SDKs, die mit dem Open Source OpenTelemetry Collector kompatibel sind, einschließlich Jaeger-, Zipkin- und X-Ray-SDKs. Zudem lässt sich Trace Analytics in AWS Distro für OpenTelemetry integrieren, einer Distribution von APIs, SDKs und Agents/Collectors für OpenTelemetry. Es ist eine performante und sichere Distribution von OpenTelemetry-Komponenten, die für den Produktionseinsatz getestet wurde und von AWS unterstützt wird. Kunden können mit AWS Distro for OpenTelemetry Traces und Metriken für mehrere Überwachungslösungen erfassen, darunter Amazon OpenSearch Service und AWS X-Ray für Nachverfolgungs-Daten und Amazon CloudWatch für Metriken.

F: Wie kann ich mit der Nutzung von Trace Analytics beginnen?
Um mit Trace Analytics zu beginnen, befolgen Sie die Anweisungen der Dokumentation, die Sie hier finden.

Weitere Informationen zu den Preisen für Amazon OpenSearch Service
Zur Seite mit den Preisen

Weitere Informationen zu den Preisen von Amazon OpenSearch Service.

Weitere Informationen 
Für ein kostenloses Konto registrieren
Für ein kostenloses Konto registrieren

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Mit der Entwicklung in der Konsole beginnen
Bereit zum Entwickeln?

Beginnen Sie mit der Entwicklung in der AWS-Managementkonsole.

Erste Schritte