AWS Glue dapat diakses di generasi berikutnya dari Amazon SageMaker

AWS Glue

Temukan, siapkan, dan integrasikan semua data Anda dalam skala apa pun

Mulai dengan AWS Glue

Pelajari selengkapnya tentang AWS Data Integration

Mengapa harus AWS Glue?

Mempersiapkan data Anda untuk mendapatkan hasil yang berkualitas merupakan langkah pertama dalam proyek analitik atau ML. AWS Glue adalah layanan integrasi data nirserver yang membuat persiapan data menjadi lebih sederhana, lebih cepat, dan lebih murah. Anda dapat menemukan dan terhubung ke lebih dari 100 sumber data yang berbeda, mengelola data dalam katalog data terpusat, dan membuat, menjalankan, serta memantau pipeline ETL secara visual untuk memuat data ke danau data. Dengan kemampuan AI generatif bawaan, Anda dapat memodernisasi tugas Spark dan berkembang lebih cepat dengan asisten cerdas untuk pembuatan ETL dan pemecahan masalah Spark.

Pengantar AWS Glue (01:54)

Keuntungan AWS Glue

Mendukung semua beban kerja

Dukungan fleksibel untuk ETL, ELT, batch, streaming, dan lainnya, tanpa penguncian

Menskalakan sesuai permintaan

Skala petabita, tagihan yang berbasis bayar sesuai penggunaan, beragam ukuran data

Alat yang disesuaikan

Mendukung semua pengguna data, mulai dari developer hingga pengguna bisnis

Bantuan AI generatif

Dapatkan bantuan yang ditenagai AI sepanjang perjalanan integrasi data Anda—mulai dari membuat kode ETL secara otomatis hingga memodernisasi tugas Spark Anda. AWS Glue menyediakan pembuatan kode cerdas, peningkatan Spark dengan bantuan AI (pratinjau), dan pemecahan masalah Spark bawaan (pratinjau).

Lengkap

Kemampuan integrasi data lengkap dalam satu layanan nirserver

Cara kerja

AWS Glue adalah layanan integrasi data nirserver yang memudahkan untuk menemukan, menyiapkan, memindahkan, dan mengintegrasikan data dari berbagai sumber untuk analitik, machine learning (ML), dan pengembangan aplikasi.

Opsi mesin integrasi data
Pilih mesin integrasi data yang Anda inginkan di AWS Glue untuk mendukung pengguna dan beban kerja Anda.

Diagram menunjukkan bagaimana pengguna AWS Glue dapat memilih dari opsi antarmuka untuk membuat beban kerja pekerjaan menggunakan beberapa mesin integrasi data. Tampilan empat bagian: satu di kiri, dua di tengah, dan satu di kanan.

Bagian pertama di sebelah kiri disebut “Sumber data.” Bagian ini mencakup sumber data berikut: “Amazon S3,” “Amazon DynamoDB,” “Basis data yang berjalan di Amazon EC2,” “Basis data,” dan “SaaS.”

Dari bagian pertama, ada anak panah yang menunjuk ke bagian tengah pada bagian atas diagram yang disebut “Pilihan antarmuka.” Tiga item yang masuk dalam bagian kedua ini: “AWS Glue Studio,” “Notebook Amazon SageMaker,” serta “Notebook dan IDE.”

Di bawah bagian kedua ini, ada teks yang berbunyi, "Buka antarmuka yang mendukung interaksi dan beban kerja pekerjaan." Teks ini juga mempunyai anak panah yang menunjuk ke bagian kedua yang dijelaskan sebelumnya di atasnya dan anak panah yang menunjuk ke bagian ketiga di bawahnya.

Bagian ketiga ini disebut "Mesin integrasi data." Teksnya berbunyi, "Pilih nirserver yang diinginkan, mesin pemrosesan data yang dapat diskalakan dengan penskalaan otomatis serta harga bayar sesuai pemakaian." Bagian ini berisi tiga nama mesin: “AWS Glue for Ray,” “AWS Glue for Python Shell,” dan “AWS Glue for Apache Spark.”

Bagian keempat muncul di sebelah kanan bagian kedua dengan tanda panah yang menunjuk dari bagian kedua ke bagian keempat. Bagian keempat berbunyi, "Buat dan muat data ke danau data dan gudang data." Bagian ini juga berisi tiga item: “Amazon Redshift,” “Danau data,” dan “Gudang data.”

Klik untuk memperbesar
ETL yang didorong peristiwa
AWS Glue dapat menjalankan tugas extract, transform, and load (ETL) Anda saat data baru tiba. Misalnya, Anda dapat mengonfigurasi AWS Glue untuk memulai tugas ETL agar berjalan segera setelah data baru tersedia di Amazon Simple Storage Service (S3).
Katalog Data AWS Glue
Anda dapat menggunakan Katalog Data untuk menemukan dan mencari beberapa set data AWS dengan cepat tanpa memindahkan data. Setelah data dimasukkan dalam katalog, data langsung tersedia untuk pencarian dan kueri menggunakan Amazon Athena, Amazon EMR, dan Amazon Redshift Spectrum.
Tugas ETL tanpa kode
AWS Glue Studio memudahkan untuk membuat, menjalankan, dan memantau tugas ETL AWS Glue secara visual. Anda dapat membangun tugas ETL yang memindahkan dan mentransformasi data menggunakan editor seret dan letakkan, dan AWS Glue secara otomatis menghasilkan kode.
Kelola dan pantau kualitas data
AWS Glue Data Quality mengotomatisasi pembuatan aturan, manajemen, dan pemantauan kualitas data untuk memastikan data berkualitas tinggi di semua danau data dan pipeline Anda.

Diagram menunjukkan bagaimana AWS Glue Data Quality dapat digunakan untuk membuat rekomendasi aturan, memantau kualitas data, dan mengirim peringatan saat kualitas data menurun. Tiga bagian ditampilkan dari kiri ke kanan.

Bagian pertama menampilkan ilustrasi Katalog Data AWS Glue dan AWS Glue ETL. Di bawah Katalog Data AWS Glue, tercantum, “Buat katalog semua set data di danau data Anda.” Di bawah AWS Glue ETL, tercantum, “Integrasikan dan ubah data dari sumber data yang berbeda-beda.”

Bagian keduan berjudul "Kualitas Data AWS Glue." Ada tiga ikon di bagian ini. Ikon pertama adalah daftar centang. Di bawahnya, tercantum, “Rekomendasi aturan kualitas data. Mulai rekomendasi aturan kualitas data otomatis dengan cepat.” Ikon kedua adalah pensil. Di bawahnya tercantum, “Aturan kualitas data yang sudah dikonfigurasi sebelumnya. Edit atau tambah rekomendasi dengan aturan kualitas data yang sudah dikonfigurasi sebelumnya.” Ikon ketiga adalah lonceng. Di bawahnya tercantum, “Peringatan dan tindakan. Tambahkan peringatan dan tindakan untuk dilakukan saat kualitas data menurun.”

Bagian ketiga memiliki dua ikon yang bertumpuk. Ikon pertama adalah bagan bilah. Di bawahnya tercantum, “Metrik. Gunakan metrik kualitas data untuk membuat keputusan bisnis yang meyakinkan.” Ikon keduanya adalah tanda peringatan. Di bawahnya tercantum, “Peringatan. Gunakan peringatan untuk mendapatkan pemberitahuan saat kualitas menurun, dan ambil tindakan untuk memperbaiki data.”

Klik untuk memperbesar
Persiapan data
Dengan AWS Glue DataBrew, Anda dapat menjelajahi dan bereksperimen dengan data secara langsung dari danau data, gudang data, dan basis data, termasuk Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora, dan Amazon Relational Database Service (RDS). Anda dapat memilih lebih dari 250 transformasi yang dibuat sebelumnya di DataBrew untuk mengotomatiskan tugas persiapan data seperti memfilter anomali, menstandardisasi format, dan mengoreksi nilai yang tidak valid.

Selain itu, AWS Glue Studio menawarkan alat persiapan data yang memungkinkan Anda menyiapkan data dengan antarmuka visual interaktif tunjuk-dan-klik tanpa menulis kode.

Kasus Penggunaan

Sederhanakan manajemen pipeline ETL

Hapus manajemen infrastruktur dengan penyediaan otomatis dan manajemen pekerja, serta gabungkan semua kebutuhan integrasi data Anda ke dalam satu layanan.

Pelajari Penskalaan Otomatis AWS Glue selengkapnya

Mendukung berbagai kerangka kerja dan beban kerja pemrosesan

Lebih mudah mendukung berbagai kerangka kerja pemrosesan data, seperti ETL dan ELT, serta beragam beban kerja, termasuk batch, mikro batch, dan streaming.

Pelajari streaming tugas ETL selengkapnya

Jelajahi, lakukan eksperimen, dan proses data secara interaktif

Dengan menggunakan sesi interaktif AWS Glue, teknisi data dapat secara interaktif menjelajahi dan mempersiapkan data menggunakan lingkungan pengembangan terintegrasi (IDE) atau notebook pilihan mereka.

Pelajari Sesi Interaktif AWS Glue selengkapnya

Temukan data secara efisien

Identifikasi data di AWS, on-premise, dan cloud lainnya dengan cepat, lalu sediakan data tersebut secara instan untuk pembuatan kueri serta transformasi.

Pelajari Katalog Data AWS Glue selengkapnya

Yang baru

1-10 (30)

Hasil tidak ditemukan

Mengumumkan dukungan tampilan Katalog Data AWS Glue dengan AWS Glue 5.0

14/03/2025
AWS Glue kini tersedia di dua region baru

12/03/2025
AWS Glue memperluas konektivitas ke 14 konektor asli untuk aplikasi

31/01/2025
Katalog Data AWS Glue menawarkan pengoptimalan otomatis tingkat lanjut untuk tabel Apache Iceberg

19/12/2024
AWS Glue memperluas konektivitas ke 16 konektor asli untuk aplikasi

18/12/2024
Memperkenalkan AWS Glue 5.0 di Wilayah AWS GovCloud (AS)

17/12/2024
Memperkenalkan AWS Glue 5.0

03/12/2024
Katalog Data AWS Glue sekarang mengotomatiskan pembuatan statistik untuk tabel baru

03/12/2024
AWS memperluas konektivitas data untuk Amazon SageMaker Lakehouse dan AWS Glue

03/12/2024
Pemberian Akses Amazon S3 kini terintegrasi dengan AWS Glue

03/12/2024

1 …

… 3

Mulai Glue

Coba AWS Glue secara gratis

Bangun dengan AWS Glue

Integrasikan data Anda

Jelajahi panduan developer

Apakah Anda menemukan apa yang Anda cari sekarang?

Beri tahu kami agar kami dapat meningkatkan kualitas konten di halaman kami.

Jelajahi selengkapnya tentang AWS