Quantitative Biology Center beschleunigt neue Genomforschung mit AWS

QuadX

Analyse von Unterschieden in der Genexpression

Forscher des Quantitative Biology Centers (QBiC) nutzen täglich HPC-Plattformen (High Performance Computing), um Genomdaten zu analysieren und zum Beispiel Unterschiede in der Genexpression zwischen krankem und gesundem Gewebe zu bestimmen. Das QBiC ist an der Universität Tübingen angesiedelt und unterstützt die Genomforschung innerhalb der Universität und in anderen Forschungseinrichtungen auf der ganzen Welt.

Die HPC-Workloads von QBiC werden größtenteils in einem Rechenzentrum vor Ort gehostet. Da das Volumen der Forschungsdaten jedoch weiterhin rapide ansteigt, sieht QBiC Schwierigkeiten bei der raschen und kosteneffizienten Skalierung voraus. „Da unser Datenvolumen immer größer wurde, erkannten wir, dass wir viel mehr Rechenkapazität benötigten, als unsere On-Premises-Infrastruktur bereitstellen konnte,“ sagt Alex Peltzer, leitender Bioinformatik-Forscher bei QBiC. „Die Forscher, die unsere Plattform verwenden, benötigten ebenfalls eine bessere Leistung, damit sie mehr Daten analysieren und ihre Forschung schneller abschließen können.“ Der höchste Mehrwert von QBiC ist die Datenverarbeitung nach den FAIR-Datenprinzipien: auffindbar, zugänglich, interoperabel und reproduzierbar. „Die Erfüllung der FAIR-Verarbeitungsanforderungen erfordert eine effiziente Skalierung, die wir nicht ohne weiteres vornehmen konnten“, sagt Peltzer.

„Das geprüfte System kann unsere Genomforschungszeit aufgrund der Automatisierung und Orchestrierung, die wir mit AWS Batch erhalten, potenziell um 50 Prozent reduzieren.“

Alex Peltzer, Senior Bioinformatics Research Scientist, Quantitative Biology Center, Universität Tübingen

  • Über das Quantitative Biology Center
  • Das Quantitative Biology Center (QBiC) ist eine Forschungseinheit an der Universität Tübingen in Deutschland. QBiC betreibt eine HPC-Forschungsplattform für interne und externe Forscher zur Analyse und Verarbeitung von Genomikdaten.

  • Vorteile
    • Kann bis zu 100 000 genetische Proben in einem einzigen Forschungsprojekt verarbeiten
    • Reduziert die Zeit für die Genomforschung um 50 %.
    • Beschleunigt die Erforschung von Unterschieden in der Genexpression
    • Senkt die Kosten für Analysen
  • Genutzte AWS-Services

Einsatz einer HPC-Forschungsplattform und von AWS-basiertem Cloud-Computing

QBiCs Bedarf an Skalierbarkeit und Leistung führte das Unternehmen zur Amazon Web Services (AWS)-Cloud. „Wir wussten, dass die Cloud unsere Anforderungen erfüllen würde, und AWS bietet eine fortschrittlichere Technologie als die anderen Anbieter, die wir uns angesehen haben“, sagt Peltzer. AWS ist auch mit den Frameworks Nextflow und nf-core kompatibel, die skalierbare wissenschaftliche Workflows mit Software-Containern unterstützen. „AWS arbeitet sehr gut mit Nextflow zusammen, und kein anderer Cloud-Anbieter könnte das leisten“, sagt Peltzer. „Ohne diese Integration hätten wir viel Zeit und Geld darauf verwenden müssen, die Planungsfunktionen selbst neu zu programmieren.“

QBiC entschied sich für die Nutzung von Amazon Elastic Compute Cloud (Amazon EC2)-Instances, die von Intel-Xeon-Scalable-Prozessoren angetrieben werden, für seine bestehende On-Premises-Infrastruktur. QBiC betreibt jetzt Nextflow auf AWS für das Workflow-Management und nutzt AWS Batch für die Automatisierung und Orchestrierung von Nextflow-Batch-Aufträgen.

Die Organisation nutzt auch Amazon EC2 Spot Instances, um die Kosten für die Analyse zu senken. EC2 Spot Instances sind freie Rechenkapazitäten auf AWS, die mit Preisnachlässen von bis zu 90 Prozent im Vergleich zum Preis für On-Demand Instances erhältlich sind. „Wir fahren durch die Verwendung von Amazon EC2 Spot Instances die Kosten für die Analyse herunter“, sagt Peltzer. „Das sind Kosteneinsparungen, die wir in die Forschung stecken können.“

Verarbeitung von 100 000 genetischen Proben

Da QBiC seine Workloads in Nextflow auf AWS ausführt, kann es die Vorteile der Parallelverarbeitung nutzen und bei Bedarf skalieren. „Durch die Nutzung von AWS können wir unsere HPC-Plattform schnell nach oben oder unten skalieren, egal ob wir 30 genetische Proben oder 100 000 Proben in einem Forschungsprojekt verarbeiten“, sagt Peltzer. Darüber hinaus erfahren QBiC und seine Forschungskunden eine höhere Zuverlässigkeit bei Genomik-Sequenzierungsaufträgen. „Wir müssen uns keine Sorgen mehr über Systemausfälle und Leistungseinbußen machen, weil zu viele Leute in der Warteschlange für die Bearbeitung von Aufträgen stehen“, sagt Peltzer. Obwohl das System derzeit in technischen Forschungsprojekten eingesetzt wird, deuten die aktuellen Ergebnisse auf einen möglichen Einsatz in der Produktion hin.

Zeitersparnis in der Genomforschung um 50 %

In seinen Benchmarking-Projekten hat das QBiC seine Forschungs- und Verarbeitungszeiten für alle Aufträge durch den Einsatz von Amazon EC2 und AWS Batch reduziert, sowohl für die Universität als auch für private Forschungsorganisationen, die Ressourcen mit dem Zentrum teilen. „Das geprüfte System kann unsere Genomforschungszeit aufgrund der Automatisierung und Orchestrierung, die wir mit AWS Batch erhalten, potenziell um 50 Prozent verkürzen“, sagt Peltzer. „Wir können die Dinge im Vergleich zu unserer On-Premises-Umgebung viel schneller erledigen.“

Infolgedessen sehen QBiC und andere Forschungseinrichtungen in Deutschland ein großes Potenzial in der Nutzung von AWS-Cloud-Anwendungen. Eine verteilte Infrastruktur hilft QBiC bei der Analyse der Genexpression, um Mutationen zu finden, die möglicherweise an Krebs beteiligt sind und die Forschung schneller abzuschließen. „Mit der Durchführung von genomischen Sequenzierungen auf AWS untersuchen wir Daten von Pflanzen und Tieren, um zu sehen, wie experimentelle Behandlungen die Ausprägung bestimmter Gene verändern“, sagt Peltzer.

QBiC wird die Nutzung von AWS-Services weiterhin evaluieren, wenn seine Forschungsanforderungen steigen. „Wir rechnen damit, dass wir in den nächsten Jahren Teil eines der größten öffentlichen Genomsequenzierungs-Hubs in Deutschland sein werden“, sagt Peltzer. „AWS wird uns helfen, dies zu ermöglichen.“

Weitere Informationen

Weitere Informationen finden Sie unter aws.amazon.com/hpc.