ما هو الانتشار المستقر؟
Stable Diffusion (الانتشار المستقر) هو نموذج ذكاء اصطناعي مولِّد (generative AI) ينتج صورًا واقعية فريدة من نوعها من أوامر النص والصورة. تم إطلاقه في الأصل في عام 2022. يمكنك استخدام النموذج لإنشاء صور، وأيضًا مقاطع فيديو ورسوم متحركة. يعتمد النموذج على تقنية الانتشار ويستخدم المساحة الكامنة (latent space). هذا يقلل بشكل كبير من متطلبات المعالجة، ويمكنك تشغيل النموذج على أجهزة الكمبيوتر المكتبية أو المحمولة المزودة بوحدات معالجة الرسومات (GPU). يمكن ضبط Stable Diffusion بدقة لتلبية احتياجاتك الخاصة بأقل من خمس صور من خلال التعلم الانتقالي.
Stable Diffusion متاح للجميع بموجب ترخيص متساهل. هذا يميّز نموذج Stable Diffusion عن النماذج السابقة.
ما أهمية نموذج Stable Diffusion؟
يعد Stable Diffusion مهمًا لأنه يسهل الوصول إليه ويسهل استخدامه. يمكن تشغيله على بطاقات رسومات من فئة المستهلك. لأول مرة، يمكن لأي شخص تنزيل النموذج وإنشاء صوره. يمكنك أيضًا التحكم في المعلمات التشعبية الرئيسية، مثل عدد خطوات تقليل الضوضاء ودرجة الضوضاء المطبقة.
من السهل استخدام Stable Diffusion، ولا تحتاج إلى معلومات إضافية لإنشاء الصور. لديها مجتمع نشط، لذلك يحتوي Stable Diffusion على الكثير من الوثائق والبرامج التعليمية الإرشادية. يخضع إصدار البرنامج لترخيص Creative ML OpenRAIL-M، ما يتيح لك استخدام البرامج المعدلة وتغييرها وإعادة توزيعها. إذا أصدرت برنامجًا مشتقًا، فعليك إصداره بموجب الترخيص نفسه وتضمين نسخة من ترخيص Stable Diffusion الأصلي.
لماذا تعتبر إدارة الحوادث مهمة؟
ترشد إدارة الحوادث فرق تكنولوجيا المعلومات بشأن الاستجابة الأنسب لأي حادث. وتنشئ نظامًا يسمح لفرق تكنولوجيا المعلومات بتسجيل جميع التفاصيل ذات الصلة للتعلّم بشكل أفضل منها. يمكنك اعتبار إدارة الحوادث بمثابة دليل لاستعادة العمليات العادية في أسرع وقت ممكن، مع جعل العملاء الداخليين والخارجيين يتعرّضون بأقل درجة ممكنة لتعطل الخدمة.
بدون وجود أنظمة، يؤدي التعافي من الحوادث حتمًا إلى أخطاء متكررة وإساءة استخدام الموارد وتأثير سلبي أكبر على المنظمة. بعد ذلك، نناقش بعض الطرق التي يمكنك من خلالها الاستفادة من إدارة الحوادث.
تقليل حدوث الحوادث
يمكن للفرق حل الحوادث في أسرع وقت ممكن من خلال وجود دليل يشرح الخطوات اللازمة في حالة وقوع حادث. في الوقت نفسه، تقلل إدارة الحوادث أيضًا من وقوع الحوادث بمرور الوقت. عندما تحدد المخاطر مبكرًا في عملية إدارة الحوادث، فهذا يقلل من فرصة وقوع حوادث في المستقبل. يساعد الحصول على التحليلات التشخيصية الكاملة الخاصة بالحوادث في المعالجة الاستباقية ويساعد على منع وقوع حوادث مماثلة لاحقًا.
الأداء المُحسّن
عند استخدام المراقبة الفعالة والحساسة في إدارة حوادث تكنولوجيا المعلومات، يمكنك تحديد التراجعات الطفيفة في الجودة والتحقيق فيها. يمكنك أيضًا اكتشاف طرق جديدة لتحسين الأداء. وبمرور الوقت، يمكن لفريق تكنولوجيا المعلومات في مؤسستك الحكم على جودة أنماط تحديد حوادث الخدمة، ما يمكن أن يؤدي إلى المعالجة التنبؤية والخدمة المستمرة.
تعاون فعال
غالبًا ما يتعين على الفرق المختلفة العمل معًا للتعافي من الحوادث. يمكنك تحسين التعاون بشكل كبير من خلال تحديد إرشادات التواصل في إطار استجابة جميع الأطراف للحوادث. يمكنك أيضًا إدارة مشاعر أصحاب المصلحة بشكل أكثر فعالية.
كيف يعمل نموذج Stable Diffusion؟
كنموذج نشر، يختلف Stable Diffusion عن العديد من نماذج إنشاء الصور الأخرى. من حيث المبدأ، تستخدم نماذج الانتشار الضوضاء الغاوسية (Gaussian) لترميز الصورة. بعد ذلك، تستخدم متنبئًا بالضوضاء جنبًا إلى جنب مع عملية الانتشار العكسي لإعادة إنشاء الصورة.
بصرف النظر عن الاختلافات التقنية لنموذج الانتشار، فإن Stable Diffusion فريد من نوعه، فهو لا يستخدم مساحة البكسل للصورة. بدلاً من ذلك، يستخدم مساحة كامنة ذات تعريف مخفض.
والسبب في ذلك هو أن الصورة الملونة بدقة 512×512 تحتوي على 786,432 قيمة محتملة. وبالمقارنة، يستخدم Stable Diffusion صورة مضغوطة أصغر بـ 48 مرة عند 16,384 قيمة. هذا يقلل بشكل كبير من متطلبات المعالجة. ولهذا السبب، يمكنك استخدام Stable Diffusion على سطح مكتب مع NVIDIA GPU مع 8 غيغابايت من ذاكرة الوصول العشوائي. تعمل المساحة الكامنة الأصغر لأن الصور الطبيعية ليست عشوائية. يستخدم Stable Diffusion ملفات التشفير التلقائي المتغيرة (VAE) في وحدة فك الترميز لرسم تفاصيل دقيقة مثل العيون.
تم تدريب Stable Diffusion V1 باستخدام ثلاث مجموعات بيانات جمعتها LAION من خلال الزحف المشترك (Common Crawl). يتضمن ذلك مجموعة بيانات LAION-Aesthetics v2.6 للصور ذات التصنيف الجمالي 6 أو أعلى.
ما هي الهيكلة التي يستخدمها Stable Diffusion؟
تشمل المكونات الهيكلية الرئيسية الخاصة بنموذج Stable Diffusion التشفير التلقائي المتغير، والانتشار الأمامي والعكسي، والتنبؤ بالضوضاء، وتكييف النص.
التشفير التلقائي المتغير
يتكون التشفير التلقائي المتغير من مشفر منفصل ووحدة فك ترميز. يضغط برنامج التشفير الصورة 512x512 بكسل إلى نموذج أصغر بحجم 64×64 في مساحة كامنة يسهل معالجتها. تستعيد وحدة فك الترميز النموذج من المساحة الكامنة بشكل صورة بحجم كامل يبلغ 512x512 بكسل.
الانتشار الأمامي
يضيف الانتشار الأمامي تدريجيًا ضوضاء غاوسية (Gaussian) إلى الصورة حتى يصبح كل ما تبقى هو ضوضاء عشوائية. لا يمكن استخدام الصورة النهائية الصاخبة لتحديد شكل الصورة الأصلي. أثناء التدريب، تمر جميع الصور بهذه العملية. لا يتم استخدام الانتشار الأمامي مرة أخرى إلا عند إجراء عملية تحويل صورة إلى صورة.
الانتشار العكسي
هذه العملية هي في الأساس عملية ذات معايير تؤدي بشكل متكرر إلى التراجع عن الانتشار الأمامي. على سبيل المثال، يمكنك تدريب النموذج باستخدام صورتين فقط، مثل قطة وكلب. إذا قمت بذلك، فإن العملية العكسية ستنجرف نحو قطة أو كلب ولا شيء آخر بينهما. من الناحية العملية، يتضمن التدريب النموذجي مليارات الصور ويستخدم الطلبات لإنشاء صور فريدة.
متنبئ الضوضاء (U-Net)
يعد متنبئ الضوضاء مفتاحًا لتقليل الضوضاء في الصور. يستخدم Stable Diffusion نموذج U-Net للقيام بذلك. نماذج U-Net هي شبكات عصبونية التفافية تم تطويرها في الأصل لتجزئة الصور في الطب الحيوي. على وجه الخصوص، يستخدم Stable Diffusion نموذج الشبكة العصبونية المتبقية (ResNet) الذي تم تطويره لرؤية الكمبيوتر.
ويقدّر متنبئ الضوضاء مقدار الضوضاء في المساحة الكامنة ويطرح قيمته من الصورة. ثم يكرّر هذه العملية لعدد محدد من المرات، ما يقلل الضوضاء وفقًا للخطوات التي يحددها المستخدم. متنبئ الضوضاء حساس لطلبات التكييف التي تساعد في تحديد الصورة النهائية.
تكييف النص
الشكل الأكثر شيوعًا للتكييف هو الطلبات النصية. يحلّل رمز CLIP كل كلمة في الطلب نصي ويدمج هذه البيانات في متجه بقيمة 768. يمكنك استخدام ما يصل إلى 75 رمزًا في الطلب. يدخل Stable Diffusion هذه الطلبات من مشفر النص في متنبئ ضوضاء U-Net باستخدام محول نص. من خلال ضبط القيمة الأولية على مولد أرقام عشوائي، يمكنك إنشاء صور مختلفة في المساحة الكامنة.
ما هي قدرات نموذج Stable Diffusion؟
يمثل نموذج Stable Diffusion تحسنًا ملحوظًا في إنشاء نموذج تحويل النص إلى صورة. إنه متاح على نطاق واسع ويحتاج إلى طاقة معالجة أقل بكثير من العديد من نماذج تحويل النص إلى صورة الأخرى. تشمل إمكانياته تحويل النص إلى صورة، وصورة إلى صورة، والأعمال الفنية الرسومية، وتحرير الصور، وإنشاء الفيديو.
تحويل نص إلى صورة
هذه هي الطريقة الأكثر شيوعًا التي يستخدم بها الأشخاص Stable Diffusion. ينشئ نموذج Stable Diffusion صورة باستخدام طلب نصي. يمكنك إنشاء صور مختلفة عن طريق ضبط قيمة أوّلية للمولد العشوائي أو تغيير جدول تقليل الضوضاء لمختلف التأثيرات.
تحويل صورة إلى صورة
باستخدام صورة الإدخال وتوجيه الطلبات النصية، يمكنك إنشاء صور استنادًا إلى صورة الإدخال. قد تكون الحالة النموذجية هي استخدام رسم والطلب المناسب.
إنشاء الرسومات والأعمال الفنية والشعارات
من خلال توجيه مجموعة من الطلبات، من الممكن إنشاء أعمال فنية ورسومات وشعارات في مجموعة متنوعة من الأنماط. بطبيعة الحال، لا يمكن تحديد المخرجات مسبقًا، مع أنه يمكنك تحديد خطوات إنشاء الشعار باستخدام رسم تخطيطي.
تحرير الصور وتنقيحها
يمكنك استخدام نموذج Stable Diffusion لتحرير الصور وتنقيحها. باستخدام أداة التعديل المستندة إلى الذكاء الاصطناعي AI Editor، عليك تحميل صورة واستخدم فرشاة الممحاة لإخفاء المنطقة التي تريد تعديلها. بعد ذلك، من خلال إنشاء طلب يحدّد ما تريد تحقيقه، عدِّل الصورة أو أعد رسمها. على سبيل المثال، يمكنك إصلاح الصور القديمة، وإزالة الكائنات من الصور، وتغيير ميزات الموضوع، وإضافة عناصر جديدة إلى الصورة.
إنشاء الفيديو
باستخدام ميزات مثل Deforum من GitHub، يمكنك إنشاء مقاطع فيديو قصيرة ورسوم متحركة باستخدام Stable Diffusion. ومن بين تطبيقاتها الأخرى هو إضافة أنماط مختلفة للفيلم. يمكنك أيضًا تحريك الصور من خلال خلق انطباع بالحركة، كما هو الحال مع المياه المتدفقة.
كيف يمكن أن تساعد AWS بتقديم نموذج Stable Diffusion؟
تُعد Amazon Bedrock أسهل طريقة لإنشاء تطبيقات الذكاء الاصطناعي المولّد وتوسيع نطاقها باستخدام نماذج التأسيس. Amazon Bedrock هي خدمة مُدارة بالكامل تجعل نماذج التأسيس الرائدة، ومنها نموذج Stable Diffusion (الانتشار المستقر)، متاحة من خلال واجهة برمجة تطبيقات (API)، ما يسمح لك بالاختيار من بين العديد من نماذج التأسيس للعثور على النموذج الأنسب لحالة استخدامك. باستخدام Bedrock، يمكنك تسريع تطوير تطبيقات الذكاء الاصطناعي المولّد القابلة للتوسع والجديرة بالثقة والآمنة ونشرها بدون إدارة البنية التحتية.
يوفر Amazon SageMaker JumpStart، وهو مركز تعلم آلة يقدم النماذج والخوارزميات والحلول، إمكانية الوصول إلى مئات من نماذج التأسيس، بما في ذلك نماذج التأسيس الأفضل أداءً المتاحة للجمهور، مثل نموذج Stable Diffusion. تستمر إضافة نماذج أساسية جديدة، بما في ذلك Stable Diffusion XL 1.0، أحدث إصدار من نموذج إنشاء الصور.