FAQ AWS HealthOmics
Alur Kerja
-
Apa perbedaan antara alur kerja privat dan Ready2Run?
HealthOmics menawarkan dua jenis alur kerja: alur kerja privat dan alur kerja Ready2Run. Alur kerja privat adalah alur kerja khusus yang memungkinkan Anda untuk membawa skrip bioinformatika Anda sendiri untuk ditulis dalam bahasa alur kerja yang paling umum digunakan. Alur kerja Ready2Run adalah pipeline bioinformatika bawaan berdasarkan analisis industri umum yang memungkinkan Anda memulai dengan cepat tanpa menulis kode.
-
Bahasa alur kerja bioinformatika mana yang didukung HealthOmics?
Alur kerja privat HealthOmics dapat ditulis dalam Nextflow, WDL, dan CWL. Untuk informasi versi yang didukung, lihat dokumentasi.
-
Apa jenis alur kerja Ready2Run yang tersedia?
HealthOmics menawarkan berbagai macam alur kerja Ready2Run mulai dari GATK dan AlphaFold Broad Institute hingga alur kerja dari penerbit pihak ketiga seperti NVIDIA, Element Biosciences, Sentieon, dan Ultima. Anda dapat melihat daftar lengkap alur kerja Ready2Run yang tersedia di sini.
-
Bisakah saya menjalankan Biological Foundation Models (bioFM) di HealthOmics?
Ya, HealthOmics dapat menjalankan bioFM, seperti NVIDIA NIM, AlphaFold, dan ESMFold. Anda dapat mengatur beberapa bioFM dalam alur kerja, membuka pipeline penemuan obat dalam skala besar. Untuk contoh alur kerja penemuan obat yang menggunakan bioFM, lihat repositori alur kerja penemuan obat di GitHub.
-
Apa yang saya perlukan untuk memulai alur kerja privat?
Untuk menjalankan alur kerja privat pertama Anda, Anda memerlukan skrip alur kerja yang ditulis dalam Nextflow, WDL, atau CWL. Selain itu, semua alat dan dependensi harus ditempatkan dalam kontainer dan disimpan dalam repositori ECR pribadi. Data input dapat disediakan di S3 atau dari penyimpanan urutan HealthOmics.
-
Bagaimana cara mengelola biaya alur kerja privat saya?
Anda dapat mengelola sumber daya alur kerja privat dengan grup run. Grup run memungkinkan Anda mengontrol proses serentak maksimum, durasi run maksimum, vCPU, dan GPU run yang ditetapkan ke grup run. Selain itu, HealthOmics menyediakan alat ukuran yang tepat, seperti Penganalisis Run, yang membantu Anda mengoptimalkan alokasi sumber daya untuk meningkatkan efisiensi berjalan.
-
Apa saja opsi penyimpanan run saya?
Alur kerja privat HealthOmics menawarkan dua opsi penyimpanan run: penyimpanan run statis dan penyimpanan run dinamis. Dengan penyimpanan run statis, sistem file ukuran tetap disediakan pada awal proses dan digunakan oleh tugas untuk penyimpanan file perantara selama dijalankan. Ketika proses selesai, output run diekspor ke S3 dan sistem file tidak disediakan. Penyimpanan run dinamis dapat diskalakan naik dan turun secara otomatis sesuai dengan kebutuhan penyimpanan Anda selama durasi run dan menawarkan waktu penyediaan yang lebih cepat. Penyimpanan run dinamis direkomendasikan untuk siklus pengembangan yang cepat dan berulang dan pipeline yang berjalan pendek dan kecil. Penyimpanan run statis cocok untuk alur kerja besar. Ini memberikan throughput sistem file yang lebih tinggi per GiB dan biaya yang lebih rendah per GiB daripada penyimpanan run dinamis.
-
Bagaimana cara memantau alur kerja saya?
Alur kerja HealthOmics mengirimkan log waktu nyata ke CloudWatch selama run dan log tambahan setelah run selesai. Anda dapat menggunakan EventBridge untuk membuat peringatan otomatis untuk kondisi yang Anda tentukan.
-
Dapatkah saya berbagi alur kerja dengan akun AWS lainnya?
Ya, alur kerja HealthOmics dapat dibagikan dengan akun AWS yang berbeda di wilayah yang sama dengan menggunakan fitur berbagi sumber daya. Untuk berbagi alur kerja, Anda memerlukan ID akun dari akun AWS yang ingin Anda bagikan. Berbagi alur kerja akan mengirimkan undangan berbagi ke penerima. Penerima harus menerima permintaan berbagi sebelum mereka dapat menjalankan alur kerja yang dibagikan. Pemilik alur kerja dapat mencabut akses kapan saja dan penerima tidak dapat mengubah atau menghapus alur kerja yang dibagikan.
-
Fitur apa yang memastikan penyediaan data dan kemampuan reproduktif alur kerja saya?
File yang digunakan sebagai input run dari S3 dan penyimpanan urutan HealthOmics diberi ETag unik untuk identifikasi file, wadah yang disimpan di repositori ECR pribadi Anda diberi hash unik, dan alur kerja tidak dapat diubah setelah dibuat untuk memastikan kemampuan reproduktif penuh dari run. Setiap run diberi uuid unik secara global yang dapat digunakan untuk mengidentifikasi setiap run unik, hasil run, dan log terkait. Uuid ini dapat dihubungkan ke sistem informasi laboratorium internal Anda (LIMS), Notebook lab elektronik (ELN), atau sistem manajemen sampel untuk memenuhi kemampuan penelusuran dan menjalankan persyaratan kemampuan reproduktif.
-
Apakah saya perlu menggunakan penyimpanan data dan alur kerja HealthOmics bersama-sama atau dapatkah keduanya digunakan secara terpisah?
Pelanggan dapat menggunakan alur kerja dan penyimpanan data bersama-sama atau sebagai solusi mandiri. Alur kerja HealthOmics kompatibel dengan S3 dan urutan serta penyimpanan referensi HealthOmics. Urutan dan penyimpanan referensi HealthOmics dapat digunakan dengan alur kerja HealthOmics, AWS Batch, dan solusi komputasi lainnya.
Penyimpanan Data
-
Apa itu penyimpanan data HealthOmics?
HealthOmics menawarkan dua jenis penyimpanan data: penyimpanan yang berfokus pada objek dan penyimpanan yang dapat dikueri. Penyimpanan yang berfokus pada objek adalah penyimpanan referensi dan urutan. Penyimpanan tersebut dirancang untuk menyimpan dan mengatur file molekuler dengan hemat biaya. Penyimpanan yang dapat dikueri adalah penyimpanan varian dan anotasi. Penyimpanan tersebut dirancang untuk secara hemat biaya mengubah data varian dan anotasi menjadi penyimpanan yang dioptimalkan untuk kueri dan kohort. Bersama-sama, penyimpanan ini dirancang untuk memberikan penyimpanan sampel, kueri, kohort, dan pengambilan yang FAIR (dapat ditemukan, dapat diakses, dapat dioperasikan, dapat digunakan kembali), pada skala petabyte.
-
Bagaimana penyimpanan data HealthOmics membantu saya menghemat biaya?
Penyimpanan data HealthOmics mendorong penghematan dengan berbagai cara. Penyimpanan urutan menggunakan peningkatan dan kompresi yang digerakkan oleh penggunaan untuk mengurangi biaya penyimpanan untuk objek yang belum diakses selama 30 hari. Hal ini dapat menghasilkan penghematan yang signifikan dibandingkan dengan penyimpanan objek AWS tradisional.
Penyimpanan varian dan anotasi HealthOmics adalah penyimpanan Zero-ETL sehingga Anda hanya membayar penyimpanan dan data yang dipindai saat melakukan kueri. Penghematan didorong dengan menghilangkan biaya ETL dan dengan memisahkan data varian dan anotasi sehingga data varian tidak harus direplikasi ketika ada keinginan untuk mengubah anotasi. Selain itu, karena penyimpanan varian dipartisi oleh informasi sampel, kueri berbasis sampel memindai lebih sedikit data yang mengarah ke penghematan biaya hilir lebih lanjut.
-
Jenis data apa yang dapat saya simpan di penyimpanan data HealthOmics?
Setiap penyimpanan data dirancang untuk tipe data yang berbeda. Penyimpanan referensi HealthOmics mendukung file FASTA. Penyimpanan urutan HealthOmics mendukung file FASTQ, uBAM, BAM, dan CRAM. Penyimpanan varian mendukung ekstraksi data dari file VCF. Penyimpanan Anotasi mendukung ekstraksi data dari GFF, TSV, CSV, VCF.
-
Berapa banyak data yang dapat saya simpan di penyimpanan data HealthOmics?
Total volume data dan jumlah objek yang dapat Anda simpan di AWS HealthOmics hampir tidak terbatas. Meskipun setiap toko memiliki penyimpanan yang dapat disesuaikan pada ukuran file dan jumlah yang didukung, file dapat terus ditambahkan sesuai kebutuhan dengan pelanggan yang secara rutin menyimpan dalam 10 petabyte di penyimpanan.
-
Seberapa andal penyimpanan data HealthOmics?
Penyimpanan data HealthOmics dibangun di atas daya tahan dan ketahanan Amazon S3 yang mencakup objek yang disimpan secara redundan di beberapa perangkat dan Zona Ketersediaan di AWS Region. Penyimpanan urutan mempertahankan dan memantau identitas semantik objek memastikan bahwa konten file dipertahankan selama siklus aktivasi dan pengarsipan.
-
Bagaimana cara mengintegrasikan penyimpanan urutan dengan alat analitik saya?
Penyimpanan urutan HealthOmics dapat diintegrasikan secara langsung dengan sebagian besar alat analisis melalui URI akses S3 untuk objek atau menggunakan alat pendamping. Setiap objek yang disimpan dalam urutan penyimpanan memiliki URI S3 unik yang dapat digunakan untuk membacanya menggunakan sebagian besar sistem yang kompatibel dengan S3. Jika sistem memerlukan antarmuka berbasis file, Mountpoint untuk S3 dapat digunakan untuk membuat set baca atau awalan penyimpanan urutan tersedia sebagai file yang dipasang untuk dibaca. Jika penyesuaian diperlukan, integrasi dapat dilakukan menggunakan SDK Amazon atau manajer transfer HealthOmics.
-
Bagaimana penyimpanan urutan dibandingkan dengan solusi penyimpanan AWS lainnya?
Penyimpanan urutan HealthOmics dirancang untuk menyimpan data molekuler statis yang secara berkala dan sering diakses. Penyimpanan urutan telah dibangun dalam kompresi dan peningkatan, sementara juga memiliki penskalaan baca objek yang dibangun di atas S3, sehingga cocok untuk data dari semua skala dengan berbagai tingkat frekuensi akses, dari penggunaan sehari-hari hingga tahunan. Setiap penyerapan membuat kumpulan baca baru dan penyimpanan urutan mengenakan biaya untuk durasi penyimpanan minimum 30 hari sehingga tidak dimaksudkan untuk file sementara, awal, atau sering diperbarui.
Amazon S3 cocok untuk file dinamis yang sering berubah, file yang berumur pendek, dan untuk file nonmolekuler yang tidak memenuhi format yang didukung. Untuk file yang perlu dipelihara untuk alasan pengarsipan dan kepatuhan data tetapi memiliki kebutuhan akses yang sangat rendah, Amazon S3 Glacier menyediakan opsi penyimpanan yang berbeda.
Keamanan & Privasi
-
Apakah HealthOmics adalah layanan yang memenuhi persyaratan HIPAA?
Ya, AWS HealthOmics adalah layanan yang memenuhi persyaratan HIPAA. Jika Anda menyimpan informasi kesehatan yang dilindungi (PHI) di AWS, Anda harus memiliki BAA. Anda dapat segera masuk ke BAA secara online menggunakan AWS Artifact.
-
Sertifikasi keamanan dan kepatuhan apa yang dimiliki HealthOmics?
Auditor pihak ketiga menilai keamanan dan kepatuhan AWS HealthOmics sebagai bagian dari beberapa program kepatuhan AWS. Ini termasuk HIPAA, FedRAMP, dan lainnya. Lihat daftar lengkap validasi kepatuhan di sini.