ما المقصود بتحليل السبب الجذري (RCA)؟
عندما تختبر الإصدارات الجديدة الرئيسة، قد تُفاجأ في بعض الأحيان بأخطاء جديدة في بيئة الإنتاج. لماذا؟ ما الخطأ الذي حدث؟ بيئات الاختبار لا تكون دائمًا قريبةً من بيئات الإنتاج كما تأمل. يُمكن إجراء تغيرات البنية الأساسية على البيئة بدون توثيقها، وهذا يتسبب في انحراف البيئات وتفككها ببطء.
استكشاف العيوب وإصلاحها يستغرق وقتًا طويلاً. إن تعلم استكشاف الأخطاء وإصلاحها بشكل أسرع هو من أفضل الاستثمارات التي تُجريها بصفتك مطور برمجيات.
تحليل السبب الجذري (RCA) هو تقنية معينة يمكنك استخدامها في استكشاف المشكلات وإصلاحها. باستخدام هذه التقنية، يمكنك تحليل المشكلة التي تواجهها من خلال مجموعة معينة من الخطوات لتحديد السبب الأساسي للمشكلة. يعتمد تحليل السبب الجذري (RCA) على مبدأ أنه ليس من المفيد أن تعالج أعراض المشكلة في حين تتجاهل جذورها.
ما مزايا تحليل السبب الجذري؟
تحليل السبب الجذري (RCA) هو تقنية معينة يمكنك استخدامها في استكشاف المشكلات وإصلاحها. باستخدام هذه التقنية، يمكنك تحليل المشكلة التي تواجهها من خلال مجموعة معينة من الخطوات لتحديد السبب الأساسي للمشكلة. يعتمد تحليل السبب الجذري (RCA) على مبدأ أنه ليس من المفيد أن تعالج أعراض المشكلة في حين تتجاهل جذورها.
كيف أبدأ تحليل السبب الجذري؟
توضيح المشكلة
استخدم طريقة rubber duck approach (rubber-duck debugging) لتوضح المشكلة ببساطة. عند توضيح أي شيء، ينبغي لك ترتيب أفكارك. Jeff Atwood، أحد مؤسسي موقع الأسئلة والأجوبة الشهير Stack Overflow، يتحدث عن عدد المرات التي يخبره مطور برمجيات حول كتابة سؤال جديد على الموقع، واكتشاف الإجابة بنفسه أثناء العملية، وعدم إرسال السؤال إلى الموقع.
استخدم الوسائل التالية لمساعدتك في التعبير عن المشكلة ببساطة:
- اكتب سؤالاً على موقع Stack Overflow، حتى وإن لم ترسله مطلقًا.
- قدم تقريرًا مفصلًا عن الخطأ.
- اشرح المشكلة لأحد زملاء العمل.
اجمع بيانات السجل (وابحث فيها بشكل فعّال)
بعد ذلك، اجمع المزيد من البيانات حول المشكلة واستخرج منها الرؤى والأفكار. يساعد التسجيل والمراقبة في هذا الأمر؛ أي سجلات الأعطال وسجلات التطبيقات وسجلات الخوادم إلخ. عليك جمع الأدلة على حدوث المشكلة، لكن أيضًا عليك اكتشاف منذ متى تحدث وما معدل تكرارها.
من كل تلك البيانات، تحتاج إلى العثور سريعًا على نقاط بيانات محددة. يمكن أن تساعدك الأدوات في البحث في بيانات السجلات التي كنت تجمعها وتحليلها وتحويلها إلى رؤى وأفكار لتشخيص المشكلات وحلها بسرعة أكبر.
استخدم طريقة الأسباب الخمسة
بعد ذلك، حدد العوامل المسببة، أي السبب المباشر في المشكلة التي تواجهها. لا تقم بتحديد عامل مسبب واحد ثم تتوقف. بل يجب عليك أن تواصل البحث عن طريق تقنية الأسباب الخمسة. كرر السؤال "لماذا؟" حتى تصل إلى أصل المشكلة. على سبيل المثال، يعرض موقعك الإلكتروني الخطأ 500.
- لماذا؟ لأن مُكون توجيه الإطار العام للشبكة مُعطل.
- لماذا؟ لأنه يتطلب وجود مُكون آخر هو أيضًا مُعطل.
- لماذا؟ لأن مُكون الإطار العام للشبكة هذا يتطلب امتداد intl، الذي لا يعمل.
- لماذا؟ لأنه تم إلغاء تنشيطه بالخطأ بعد تحديث برمجيات الخادم.
ستصل بالطبع إلى المشكلة الجذرية بخطوات أقل. أو قد تحتاج إلى خطوات أكثر.
المراجعة من شخص آخر
مثل مراجعة التعليمة البرمجية، اطلب من شخص آخر غير متحيز إلقاء نظرة على التعليمة البرمجية. مع مرور الوقت، يساعدك توقع المراجعة في تحسين عمليتك. أو الأفضل من ذلك، اجعل عملية استكشاف الأخطاء وإصلاحها عمليةً ثنائيةً.
كيف يمكن لـ AWS دعم تحليل السبب الجذري؟
أحد عروض AWS الأساسية في تحليل السبب الجذري هو مساعدتك في استيعاب بيانات السجلات وتحليلها. ولهذا، نوصي باستخدام Amazon OpenSearch Service. تسهّل خدمة Amazon OpenSearch Service إجراء تحليلات تفاعلية للسجلات ومراقبة التطبيقات في الوقت الفعلي والبحث في مواقع الويب وغير ذلك الكثير. OpenSearch هي مجموعة بحث وتحليلات مفتوحة المصدر وموزعة مشتقة من Elasticsearch. تتيح Amazon OpenSearch Service البحث والمراقبة والتحليل في الوقت الفعلي لبيانات الأعمال والبيانات التشغيلية المتعلقة بحالات استخدام مثل مراقبة التطبيقات وتحليلات السجلات وقابلية المتابعة والبحث في مواقع الويب.
بادر باستخدام تحليل السبب الجذري على AWS من خلال إنشاء حساب اليوم.