Was bedeutet Big Data?
Was die Datenverwaltung anbelangt, zählt Big Data zu den Herausforderungen, für die herkömmliche Datenbanken aufgrund des steigenden Volume, Geschwindigkeit und Vielfalt der Daten nicht ausreichen. Es gibt zahlreiche Definitionen für Big Data, von denen die meisten das gängige Konzept der "drei Vs" beinhalten:
Volumen: Dieses kann von Terabyte bis Petabyte reichen.
Vielfalt: Big Data beinhalten Daten aus einer Vielzahl von Quellen und Formaten (z. B. Weblogs, Social-Media-Interaktionen, eCommerce, Online-Transaktionen, Finanztransaktionen usw.)
Geschwindigkeit: Unternehmen sind gefordert, ihre generierte Daten Benutzern in immer kürzeren Zeitspannen als umsetzbare Erkenntnisse bereitzustellen. Die Daten müssen daher innerhalb relativ kurzer Zeitfenster gesammelt, gespeichert, verarbeitet und analysiert werden. Dies kann täglich oder auch in Echtzeit erforderlich sein.
Warum benötigen Sie Big Data?
Trotz des Hypes ist vielen Organisationen nicht bewusst, dass sie ein Big Data-Problem haben, oder sie betrachten es einfach nicht als Big Data. Allgemein profitieren Organisationen von Big Data-Technologie, wenn sich ihre vorhandenen Datenbanken und Anwendungen nicht weiter skalieren lassen, um einen plötzlichen Anstieg des Volumens, der Vielfalt oder der Geschwindigkeit der Daten zu unterstützen.
Werden die Herausforderungen in Verbindung mit Big Data nicht richtig in Angriff genommen, kann dies eskalierende Kosten, sinkende Produktivität und mangelnde Wettbewerbsfähigkeit zur Folge haben. Eine fundierte Big Data-Strategie wiederum ermöglicht es Organisationen, ihre Kosten zu reduzieren und die betriebliche Effizienz zu steigern. Sie können umfangreiche bestehende Verarbeitungslasten zu Big Data-Technologien migrieren und mithilfe neuer Anwendungen neue Geschäftschancen nutzen.
Wie funktionieren Big Data?
Dank neuer Tools für den gesamten Datenverwaltungszyklus ist es mit Big Data-Technologien technisch und wirtschaftlich möglich, größere Datenmengen nicht nur zu sammeln und zu speichern, sondern dies auch zu analysieren, um neue und wertvolle Erkenntnisse zu erhalten. In den meisten Fällen beinhaltet die Verarbeitung von Big Data einen allgemeinen Datenfluss, angefangen von der Sammlung von Rohdaten bis hin zur Nutzung umsetzbarer Informationen.
Sammeln. Das Erfassen der Rohdaten, etwa von Transaktionen, Protokollen oder mobilen Geräten, ist die erste Herausforderung, der sich viele Organisationen beim Umgang mit Big Data gegenüber sehen. Eine gute Big Data-Plattform erleichtert diesen Schritt. Entwickler können damit eine Vielfalt strukturierter und unstrukturierter Daten in beliebiger Geschwindigkeit sowohl in Echtzeit als auch in Batches aufnehmen.
Speichern. Jede Big Data-Plattform erfordert ein sicheres, skalierbares und langlebiges Repository, um Daten vor oder sogar nach Verarbeitungsaufgaben zu speichern. Vielleicht benötigen Sie aufgrund von speziellen Anforderungen sogar temporäre Speicher, um dort Daten während ihrer Übertragung abzulegen.
Verarbeiten und analysieren. In diesem Schritt werden die Rohdaten in ein nutzbares Format umgewandelt. Dies erfolgt in der Regel durch ein Sortieren, Aggregieren und Zusammenführen der Daten sowie deren Verarbeitung mit erweiterten Funktionen und Algorithmen. Die resultierenden Datensätze werden anschließend zur weiteren Verarbeitung gespeichert oder Benutzern über Business Intelligence- und Datenvisualisierungs-Tools bereitgestellt.
Nutzen und visualisieren. Bei Big Data geht es darum, hochwertige, umsetzbare Erkenntnisse aus Ihren Datenbeständen zu ziehen. Im Idealfall werden Daten Interessensvertretern über Self-Service Business Intelligence- und flexible Datenvisualisierungs-Tools bereitgestellt, die eine schnelle und einfache Analyse von Datensätzen ermöglichen. Je nach Analysetyp können Endbenutzer die resultierenden Daten auch für statistische Prognosen (durch Predictive Analytics) oder empfohlene Aktionen (durch Prescriptive Analytics) verwenden.
Die Entwicklung der Big-Data-Prozesse
Das Big Data-Ökosystem entwickelt sich weiter mit beeindruckender Geschwindigkeit. Mittlerweile werden in Organisationen zahlreiche Funktionen durch vielfältige Analyseformen unterstützt.
Deskriptive Analyse hilft den Benutzern bei der Beantwortung der Frage: „Was ist passiert und warum?“. Beispiele hierfür sind traditionelle Abfrage- und Berichtsumgebungen mit Scorecards und Dashboards.
Prädiktive Analyse hilft Benutzern, die Wahrscheinlichkeit eines bestimmten Ereignisses in der Zukunft zu prognostizieren. Sie wird beispielsweise in Frühwarnsystemen, bei der Betrugserkennung, in präventiven Wartungsanwendungen und für Vorhersagen eingesetzt.
Präskriptive Analyse bietet Benutzern spezifische (präskriptive) Empfehlungen. Damit wird die Frage beantwortet: Was soll ich tun, wenn Fall "x" eintritt?
Ursprünglich unterstützten Big Data Frameworks wie Hadoop nur Batch-Verarbeitungslasten. Dabei wurden große Datenmengen innerhalb eines festgelegten Zeitfensters verarbeitet, das meist mehrere Stunden oder gar Tage betrug. Da Erkenntnisse aus Big Data jedoch immer schneller erzielt werden sollten, wurden neue Frameworks wie Apache Spark, Apache Kafka, Amazon Kinesis und andere entwickelt, um die Verarbeitung von Echtzeit- und Streaming-Daten zu ermöglichen.
Wie kann AWS Ihre Big-Data-Anforderungen unterstützen?
Amazon Web Services bietet ein umfangreiches und vollständig integriertes Portfolio von Cloud-Computing-Services zum Erstellen, Sichern und Bereitstellen Ihrer Big-Data-Anwendungen. Mit AWS entfällt sowohl die Anschaffung von Hardware als auch die Verwaltung und Skalierung Ihrer Infrastruktur. Sie können Ihre Ressourcen somit voll und ganz für die Ermittlung neuer Erkenntnisse einsetzen. Da die Fähigkeiten und Funktionen permanent erweitert werden, können Sie stets die neuesten Technologien nutzen, ohne langfristige Investitionen eingehen zu müssen.
Weitere Informationen zu AWS Big Data-Plattform und -Tools »
Sofortige Verfügbarkeit
Die meisten Big Data-Technologien erfordern große Server-Cluster. Dies führt zu langen Bereitstellungs- und Einrichtungszyklen. Mit AWS können Sie die benötigte Infrastruktur fast unverzüglich bereitstellen. Des bedeutet, dass Ihre Teams produktiver arbeiten, neue Abläufe einfacher ausprobiert werden können und die Implementierungsphase für Projekte verkürzt wird.
Umfassende und tief greifende Funktionen
Big Data-Verarbeitungslasten variieren ebenso sehr wie die damit zu analysierenden Datenbestände. Eine umfassende und tief greifende Plattform bedeutet, dass Sie nahezu jede Big Data-Anwendung entwickeln und jede Workload unabhängig von Umfang, Geschwindigkeit und Vielfalt der Daten unterstützen können. Mit jährlich über 50 neuen Services und Hunderten von neuen Funktionen bietet AWS alles, was Sie zum Erfassen, Speichern, Verarbeiten, Analysieren und Visualisieren von Big Data in der Cloud benötigen. Weitere Informationen zur AWS-Big-Data-Plattform.
Vertrauenswürdig und sicher
Big Data sind sensible Daten. Daher ist es extrem wichtig, Ihre Datenbestände und Ihre Infrastruktur zu schützen, und gleichzeitig Ihre hohe Flexibilität zu bewahren. AWS bietet Funktionen quer über Standorte, Netzwerke, Software und Geschäftsprozesse hinweg, die die strengsten Anforderungen erfüllen. Umgebungen werden kontinuierlich auf Zertifizierungen wie ISO 27001, FedRAMP, DoD SRG und PCI DSS überprüft. Sicherungsprogramme helfen Ihnen, die Konformität mit mehr als 20 Standards (inklusive HIPAA, NCSC uvm.) nachzuweisen. Im Cloud-Sicherheitszentrum erhalten Sie weitere Informationen.
Hunderte von Partnern und Lösungen
Das umfangreiche Ökosystem an Partnern ermöglicht es Ihnen, Qualifikationslücken zu überbrücken und den Einstieg in Big Data weiter zu beschleunigen. Besuchen Sie das AWS-Partnernetzwerk, um den Service eines Consulting-Partners in Anspruch zu nehmen oder wählen Sie aus vielen Tools und Anwendungen für den gesamten Datenverwaltungs-Stack.
Big-Data-Lösungen bei AWS
Wir helfen Ihnen, Ihre Big-Data-Herausforderungen zu meistern. Überlassen Sie uns die schwierige Arbeit, damit Sie Ihre Zeit und Ressourcen auf Ihre Geschäftsziele fokussieren können.
Weitere Informationen zu AWS-Big-Data-Lösungen »
Beginnen Sie mit Big-Data-Analytik in AWS, indem Sie noch heute ein Konto erstellen.
Nächste Schritte in AWS
Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS.
Starten Sie mit der Entwicklung in der AWS-Managementkonsole.