AWS Glue هي خدمة تكامل بيانات بلا خادم توفر العديد من محركات تكامل البيانات لدعم المستخدمين وأعباء الأعمال. مع AWS Glue، يمكنك استخدام المحرك المناسب لأي عبء عمل، بناءً على خصائص عبء العمل وتفضيلات المطورين والمحللين لديك.
الميزات الأساسية
AWS Glue لـ Apache Spark
توفر AWS Glue بنية تحتية مُحسّنة للأداء بلا خادم لتشغيل Apache Spark لتكامل البيانات ووظائف الاستخراج، والانتقال، والتحميل (ETL). AWS Glue لـ Apache Spark تدعم المعالجة الدفعية والمتدفقة، وتُسرع من عمليات استيعاب البيانات ومعالجتها وتكاملها. يمكنك بعد ذلك إنشاء مخزن البيانات ومستودع البيانات وتحديثهما واستخراج رؤى من البيانات بسرعة أكبر.
AWS Glue for Ray
مع AWS Glue for Ray، يمكن لمهندسي البيانات والمطورين معالجة مجموعات بيانات كبيرة باستخدام Python ومكتبات Python الشهيرة. يستخدم AWS Glue إطار عمل Ray (Ray.io)، وهو إطار عمل حوسبة موحد مفتوح المصدر يُستخدم لقياس أعباء عمل Python. يتضمن AWS Glue for Ray مكتبات معالجة بيانات Python الشائعة، لذا يمكنك إحضار مكتباتك الخاصة لتخصيص مهمة تكامل البيانات الخاصة بك.
AWS Glue for Python Shell
مع AWS Glue for Python Shell، يمكنك استخدام وظيفة Python Shell لتشغيل برامج Python النصية على AWS Glue. ومن خلال هذه الوظائف، يمكنك كتابة وظائف معقدة لتكامل البيانات والتحليلات في Python. تقدم وظائف AWS Glue for Python Shell مكتبات تحليلات مشتركة خارج الصندوق، يأتي من بينها Pandas وNumPy وAmazon SageMaker Data Wrangler. يمكنك استخدام الوظائف المجمعة للاتصال بقواعد البيانات المختلفة ومستودعات البيانات وخدمات AWS.