ما الفرق بين التراجع الخطي والتراجع اللوجستي؟

يعد التراجع الخطي والتراجع اللوجستي من تقنيات تعلّم الآلة التي تقدم تنبؤات من خلال تحليل البيانات السابقة. على سبيل المثال، من خلال الاطلاع على اتجاهات شراء العملاء السابقة، يقدّر تحليل التراجع حجم المبيعات المستقبلية، ما يتيح لك إجراء عمليات شراء للمخزون مدروسةً دراسةً أوفى. تُجري تقنيات التراجع الخطي النمذجة الرياضية للعامل غير المعروف على العديد من العوامل المعروفة لتقدير القيمة الدقيقة للعامل غير المعروف. وبالمثل، يستخدم الانحدار اللوجستي الرياضيات في إيجاد العلاقات بين عاملين من عوامل البيانات. ثم يستخدم هذه العلاقة للتنبؤ بقيمة أحد هذين العامِلَين بناءً على الآخر. وعادة ما يكون للتنبؤ عددًا محدودًا (قيمة نهائية) من النتائج، مثل نعم أو لا.

اقرأ عن التراجع الخطي »

اقرأ عن التراجع اللوجستي »

تقديم التنبؤات: التراجع الخطي مقابل التراجع اللوجستي

يستخدم كل من التراجع الخطي والتراجع اللوجستي النمذجة الرياضية للتنبؤ بقيمة متغير إخراج من متغير إدخال واحد أو أكثر. متغيرات الإخراج هي متغيرات تابعة ومتغيرات الإدخال هي متغيرات مستقلة.

التراجع الخطي

كل متغير مستقل له علاقة مباشرة بالمتغير التابع وليس له علاقة بالمتغيرات المستقلة الأخرى. تُعرف هذه العلاقة بالعلاقة الخطية. عادةً ما يكون المتغير التابع قيمةً من بين مجموعة قيم متصلة.

هذه هي الصيغة، أو الدالة الخطية، لإنشاء نموذج تراجع خطي:

y= β0 + β1X1 + β2X2+… βnXn+ ε

إليك ما يعنيه كل متغير:

  • y هو المتغير التابع المتوقع
  • β0 هو التقاطع مع المحور y عندما تساوي جميع متغيرات الإدخال المستقلة 0
  • β1X1 هو معامل التراجع (B1) للمتغير المستقل الأول (X1)، قيمة تأثير المتغير المستقل الأول على المتغير التابع
  • βnXn هو معامل التراجع (BN) للمتغير المستقل الأخير (XN)، عندما تكون هناك قيم إدخال متعددة
  • ε هو خطأ النموذج

مثال على التراجع الخطي هو التنبؤ بسعر المنزل (المتغير التابع) بناءً على عدد الغرف والحي والعمر (المتغيرات المستقلة).

التراجع اللوجستي 

قيمة المتغير التابع هي واحدة من قائمة الفئات المحدودة التي تستخدم التصنيف الثنائي. هذه تسمى المتغيرات الفئوية. ومن أمثلة ذلك نتيجة بكرة النرد ذات الأوجه الستة. تُعرف هذه العلاقة بالعلاقة اللوجستية.

تقوم صيغة التراجع اللوجستي بتطبيق تحويل logit، أو لوغاريتم الأرجحية الطبيعي، على احتمال نجاح أو احتمال فشل متغير فئوي بعينه.

y = e^(β0 + β1X1 + β2X2+… βnXn+ ε) / (1 + e^(β0 + β1 x 1 + β2 x 2 +… βn x n + ε))

إليك ما يعنيه كل متغير:

  • y يعطي احتمال نجاح المتغير الفئوي y
  • e (x) هو ثابت أويلر، معكوس دالة اللوغاريتم الطبيعي أو الدالة السينية، ln (x)
  • Β0, β1X1…βnXn لهما نفس معنى التراجع الخطي في القسم السابق

مثال على التراجع اللوجستي هو التنبؤ باحتمالية أن يزيد سعر المنزل عن 500000 USD (متغير تابع) بناءً على عدد الغرف والحي والعمر (المتغيرات المستقلة).

ما أوجه التشابه بين التراجع الخطي والتراجع اللوجستي؟

يشترك التراجع الخطي والتراجع اللوجستي في بعض القواسم المشتركة ويتشابهان في مساحات التطبيق واسعة النطاق.

التحليل الإحصائي

يعد التراجع اللوجستي والتراجع الخطي شكلين من أشكال التحليل الإحصائي أو تحليل البيانات، ويندرجان ضمن مجال علوم البيانات. يستخدم كلاهما النمذجة الرياضية في الربط بين مجموعة متغيرات مستقلة أو مجموعة متغيرات معروفة وبين متغيرات تابعة. يمكنك تمثيل كل من التراجع اللوجستي والتراجع الخطي في صورة معادلات رياضية. يمكنك أيضًا تمثيل النموذج على رسم بياني.

تقنيات تعلّم الآلة

تُستخدم نماذج التراجع الخطي والتراجع اللوجستي في تعلم الآلة الخاضع للإشراف.

يتضمن تعلّم الآلة الخاضع للإشراف تدريب نموذج عن طريق إدخال مجموعات بيانات مصنفة. المتغيرات التابعة والمتغيرات المستقلة تكون معروفةً ويجمعها عناصر بشرية من الباحثين. من خلال إدخال بيانات قديمة معروفة، تتم هندسة المعادلة الرياضية هندسةً عكسيةً. في النهاية، يمكن أن تصبح التنبؤات دقيقةً لدرجة تتيح حساب المتغيرات التابعة غير المعروفة من متغيرات مستقلة معروفة.

يختلف التعلم الخاضع للإشراف عن التعلم غير الخاضع للإشراف الذي لا يتم فيه تصنيف البيانات.

اقرأ عن تعلّم الآلة »

صعوبة التدريب

يتطلب كل من التراجع اللوجستي والتراجع الخطي قدرًا كبيرًا من البيانات المصنفة حتى تصبح النماذج دقيقةً في التنبؤات. يمكن أن تكون هذه مهمةً مرهقةً للبشر. على سبيل المثال، إذا كنت تريد تحديد ما إذا كانت الصورة تحتوي على سيارة أم لا، فيجب أن تحتوي جميع الصور على علامات للمتغيرات مثل أحجام السيارات وزوايا الصور والعوائق. 

محدودية دقة التنبؤ

النموذج الإحصائي الذي يواءم بين بيانات الإدخال وبيانات الإخراج لا يعني بالضرورة وجود علاقة سببية بين المتغير التابع والمتغير المستقل. في كل من التراجع اللوجستي والتراجع الخطي، لا يكون الارتباط سببيًا.

لاستخدام مثال تسعير المنزل من القسم السابق، افترض أن اسم مالك المنزل ينضم إلى قائمة المتغيرات المستقلة. عندئذ، يرتبط اسم "جون دو" بانخفاض أسعار مبيعات المنازل. في حين أن التراجع الخطي والتراجع اللوجستي سيتوقعان دائمًا انخفاض أسعار المنازل إذا كان اسم المالك هو "جون دو"، فإن المنطق يقول أن هذه العلاقة ببيانات الإدخال غير صحيحة.

الاختلافات الأساسية: التراجع الخطي مقابل التراجع اللوجستي

يختلف التراجع اللوجستي والتراجع الخطي بشكل كبير في مناهجهما الرياضية.

قيمة الإخراج

إخراج التراجع الخطي هو مقياس قيمة متصل. على سبيل المثال، يتضمن ذلك الأرقام والكيلومترات والسعر والوزن.

في المقابل، فإن قيمة إخراج نموذج التراجع اللوجستي هي احتمالية حدوث حدث فئوي ثابت. على سبيل المثال، قد يعني 0.76 احتمالية ارتداء 76% لقميص أزرق، و0.22 قد يعني احتمالية تصويت 22% بنعم.

علاقة المتغيرات

في تحليل التراجع، خط التراجع هو شكل خط الرسم البياني الذي يمثل العلاقة بين كل متغير مستقل والمتغير التابع.

في التراجع الخطي، يكون خط التراجع مستقيمًا. أي تغييرات تطرأ على متغير مستقل يكون لها تأثير مباشر على المتغير التابع.

في التراجع اللوجستي، يكون خط التراجع عبارة عن منحنى على شكل حرف S، يُعرف أيضًا باسم المنحنى السيني.

نوع التوزيع الرياضي

التراجع الخطي يتبع التوزيع العادي أو توزيع جاوسي للمتغير التابع. يتم تمثيل التوزيع العادي بخط متصل على الرسم البياني.

التراجع اللوجستي يتبع التوزيع ثنائي الحدين. عادةً ما يتم تمثيل التوزيع ثنائي الحدين كرسم بياني شريطي.

حالات استخدام التراجع الخطي مقابل التراجع اللوجستي

يُمكنك استخدام التراجع الخطي عندما تريد التنبؤ بمتغير تابع مستمر من مقياس قيم. استخدم التراجع اللوجستي عندما تتوقع نتيجةً ثنائيةً (على سبيل المثال، نعم أو لا).

فيما يلي أمثلة للتراجع الخطي: 

  • توقع ارتفاع شخص بالغ بناءً على ارتفاع الأم والأب
  • توقع حجم مبيعات اليقطين بناءً على السعر والوقت من السنة وموقع المتجر
  • توقع سعر تذكرة الطيران بناءً على المنشأ والوجهة والوقت من العام وشركة الطيران
  • توقع عدد الإعجابات على وسائل التواصل الاجتماعي بناءً على الناشر وعدد المتابعين الحقيقيين ومحتوى المنشور وتوقيت النشر

فيما يلي أمثلة على التراجع اللوجستي:

  • توقع ما إذا كان الشخص سيصاب بأمراض القلب بناءً على مؤشر كتلة الجسم وحالة التدخين والاستعداد الوراثي
  • توقع أصناف ملابس البيع بالتجزئة التي ستكون الأكثر شيوعًا بناءً على اللون والحجم والنوع والسعر
  • توقع ما إذا كان الموظف سيستقيل في ذلك العام بناءً على معدل الأجور، والأيام التي يقضيها في المكتب، وعدد الاجتماعات، وعدد رسائل البريد الإلكتروني المرسلة، والفريق، ومدة الخدمة
  • توقع أعضاء فريق المبيعات الذين سيحصلون على عقود تزيد قيمتها عن مليون USD في السنة بناءً على مبيعات العام السابق ومدة الخدمة ومعدل العمولة

ملخص الاختلافات: التراجع الخطي مقابل التراجع اللوجستي

 

التراجع الخطي

الانحدار اللوجستي

ما التعريف؟

طريقة إحصائية للتنبؤ بقيمة الإخراج من مجموعة من قيم الإدخال.

طريقة إحصائية للتنبؤ باحتمالية أن تكون قيمة الإخراج من فئة معينة من مجموعة من المتغيرات الفئوية.

العلاقة

علاقة خطية، ممثلة بخط مستقيم.

علاقة لوجستية أو علاقة سينية، ممثلة بمنحنى على شكل حرف S.

المعادلة

خطية

لوغاريتمية

نوع التعلم الخاضع للإشراف

التراجع

التصنيف

نوع التوزيع

عادي/جاوسي

ثنائي الحدين

الاستخدام الأنسب

المهام التي تتطلب متغيرًا تابعًا مستمرًا متوقعًا من مقياس.

المهام التي تتطلب احتمالية متوقعة لمتغير تابع فئوي يحدث من مجموعة ثابتة من الفئات.

كيف يمكنك تشغيل تحليل التراجع الخطي والتراجع اللوجستي على AWS؟

يُمكنك تشغيل تحليل التراجع الخطي وتحليل التراجع اللوجستي على خدمات Amazon Web Services (AWS) باستخدام Amazon SageMaker.

SageMaker هي خدمة تعلم آلة مُدارة بالكامل تتضمن خوارزميات مدمجة لكل من التراجع الخطي والتراجع اللوجستي، من بين العديد من حزم برامج إحصائية أخرى. يُمكنك تنفيذ تراجع خطي يشتمل على العديد من قيم الإدخال التي تحتاجها، أو حل مشكلات التراجع من خلال نماذج احتمالات لوجستية.

على سبيل المثال، إليك كيفية الاستفادة التي تحققها من استخدامك SageMaker:

  • إعداد نماذج التراجع وبنائها وتدريبها ونشرها بسرعة
  • التخلص من عبء الرفع الثقيل من كل خطوة من خطوات عملية التراجع الخطي والتراجع اللوجستي وتطوير نماذج التراجع عالية الجودة
  • يُمكنك الوصول إلى جميع المكونات المطلوبة لتحليل التراجع في مجموعة واحدة من الأدوات لإدخال النماذج إلى مرحلة الإنتاج بشكل أسرع وأسهل وبتكلفة معقولة

ابدأ تحليل التراجع على AWS عن طريق إنشاء حساب اليوم.