ما المقصود بمتجر البيانات؟

متجر البيانات عبارة عن نظام تخزين بيانات يحتوي على معلومات خاصة بوحدة أعمال المؤسسة. وهو يحتوي على جزء صغير محدّد من البيانات التي تخزنها الشركة في نظام تخزين أكبر. تستخدم الشركات متجر البيانات لتحليل المعلومات الخاصة بالقسم بشكل أكثر كفاءة. فهو يوفّر بيانات موجزة يمكن لأصحاب المصلحة الرئيسيين استخدامها لاتخاذ قرارات مدروسة بسرعة. 

على سبيل المثال، قد تخزّن الشركة البيانات من مصادر مختلفة، مثل معلومات المورّدين والطلبات وبيانات جهاز الاستشعار ومعلومات الموظفين والسجلات المالية، في مستودع البيانات أو مخزن البيانات الخاصة بها. ومع ذلك، تخزّن الشركة المعلومات ذات الصلة بقسم التسويق مثلاً، مثل مراجعات وسائل التواصل الاجتماعي وسجلات العملاء، في متجر البيانات.

كيف يقارن متجر البيانات data mart بأنواع أخرى من أنظمة تخزين البيانات؟

تستخدم الشركات عدة أنواع مختلفة من أنظمة تخزين البيانات لإدارة البيانات والتحليلات. هيا نُلقِ نظرةً على بعض الأنواع الشائعة لتخزين البيانات لفهم السياق الذي تستخدم فيه الشركات متاجر البيانات data mart.

قاعدة البيانات

قاعدة البيانات عبارة عن تخزين منظم تستخدمه أنظمة الكمبيوتر لتخزين المعلومات والبحث عنها واستردادها وتحليلها. هناك أنواع مختلفة من قواعد البيانات، مثل قواعد البيانات العلائقية. تقوم قاعدة البيانات العلائقية بتخزين المعلومات في جداول تتكون من صفوف وأعمدة. يتم توصيل البيانات في جداول مختلفة بواسطة معرف فريد يعرف باسم المفتاح. المفاتيح هي القيم غير المتكررة في أعمدة محددة.

متجر البيانات Data mart مقابل قاعدة البيانات

يعمل متجر البيانات data mart كعنصر أمامي في بيانات القسم.  يمكنك استخدام متجر البيانات في استرداد المعلومات وتحليلها. وفي الوقت نفسه، تقوم قاعدة البيانات بجمع المعلومات وإدارتها وتخزينها. يُمكنك بعد ذلك استخدام أدوات لمعالجة المعلومات المخزنة وتنسيقها ونقلها إلى متجر بيانات. 

مستودع البيانات 

مستودع البيانات هو نظام قاعدة بيانات شامل يخزن المعلومات للأعمال بأكملها. يقوم بجمع المعلومات الأولية من مصادر مختلفة، مثل برامج الأعمال وموجزات الوسائط الاجتماعية، ومعالجتها في بيانات مهيكلة مخزنة في تنسيق جدولي. يمكن للشركات توصيل مستودع بيانات المؤسسة بأدوات ذكاء الأعمال لاتخاذ قرارات أكثر ذكاءً. 

متجر البيانات Data mart مقابل مستودع البيانات

يشترك متجر البيانات data mart مع مستودع البيانات في كثير من السمات. بينما يختلفان في أن مستودع البيانات يحتوي على بيانات على مستوى المؤسسة حول موضوعات مختلفة. وفي الوقت نفسه، يخزن متجر البيانات data mart المعلومات المرتبطة ارتباطًا وثيقًا بموضوع معين. على سبيل المثال، قد يقوم مستودع البيانات بتخزين معلومات لأقسام التسويق والموارد البشرية والمشتريات ودعم العملاء. ومع ذلك، قد يقوم متجر البيانات data mart بتخزين بيانات المعاملات ذات الصلة بقسم واحد فقط. يتمثل الدافع وراء بناء متجر بيانات data mart في أن الأقسام التي تدير متاجر بيانات خاصة بها تتمتع بالتحكم الكامل في تحميل بياناتها وإدارتها. 

تستخدم العديد من المؤسسات تقنيات مثل مشاركة البيانات لنشر متاجر البيانات الخاصة بها إلى مستودع بيانات مركزي.  من خلال القيام بذلك، يمكن أن يكونوا أكثر مرونةً من خلال توزيع الملكية وعزل أعباء العمل.  وبالمثل، تسمح مشاركة البيانات لمتاجر بيانات الأقسام باستهلاك البيانات المشتركة من مستودع البيانات أو متاجر البيانات الأخرى.

مخزن البيانات 

مخزن البيانات هو وحدة تخزين بيانات تحتوي على معلومات أولية وغير مهيكلة. مخزن البيانات لا يخزن المعلومات في الملفات والمجلدات. بل يخزن المعلومات غير المعالجة في تسلسل هرمي مسطح على وحدة تخزين ضخمة. تقوم مخازن البيانات بتخزين أنواع مختلفة من المعلومات الأولية، بما في ذلك المستندات النصية والصور ومقاطع الفيديو والصوت. 

يستخدم محللو البيانات مخازن البيانات في إجراء تحليل تنبؤي من البيانات غير المهيكلة. على سبيل المثال، قد يخزن مخزن البيانات نصوصًا من تقييمات وسائل التواصل الاجتماعي يمكن للشركات استخدامها في تحليل المشاعر. يمكن لمحللي البيانات استخدام تحليل المشاعر في الكشف عن اتجاهات الرأي السلبية المتعلقة بالشركة. 

متجر البيانات Data mart مقابل مخزن البيانات

نظرًا لأن مخازن البيانات تخزن بيانات غير معالجة، فقد تكون بعض المعلومات مكررةً أو قد لا تكون ذات معنى للشركة. وفي الوقت نفسه، يقوم متجر البيانات data mart بتخزين البيانات التي تمت معالجتها التي تلبي حاجةً معينة. يمكن أن يكون مخزن البيانات مصدرًا لمتجر البيانات data mart. تحدد الشركات اتجاهات البيانات من خلال النظر إلى البيانات التاريخية في متاجر البيانات، ولكنها تستخدم مخازن البيانات في تحليل المعلومات المخزنة تحليلاً عميقًا. 

OLAP

المعالجة التحليلية عبر الإنترنت (OLAP) هي طريقة لتمثيل البيانات بطريقة متعددة الأبعاد. على سبيل المثال، يستخدم محللو البيانات مكعب المعالجة التحليلية عبر الإنترنت (OLAP) لعرض إيرادات المبيعات في وقت واحد بناءً على الأشهر والمدن والمنتجات. هياكل بيانات المعالجة التحليلية عبر الإنترنت (OLAP) هي هياكل كبيرة تتضمن حقولاً مصنفةً إما حقائق أو أبعاد وتؤدي إلى تكرار البيانات.  هذا يتناقض مع قواعد البيانات العلائقية التقليدية، التي تفضل هياكل ضيقة وتكرار بيانات أقل.

متجر البيانات Data mart مقابل مكعب OLAP

المعالجة التحليلية عبر الإنترنت (OLAP) هي إستراتيجية تخزين معلومات محددة تقوم بإلغاء تسوية البيانات إلى جداول واسعة. تعمل المعالجة التحليلية عبر الإنترنت (OLAP) على تبسيط التمثيلات المعقدة للبيانات متعددة الأبعاد. وقد تقوم بعض متاجر البيانات باستخدام المعالجة التحليلية عبر الإنترنت (OLAP) في هيكلة معلوماتها، ولكن البعض الآخر يستخدم هياكل تقليدية طبيعية. يستفيد محللو الأعمال من هياكل المعالجة التحليلية عبر الإنترنت (OLAP) في عرض المعلومات بطريقة مرئية من متجر البيانات. 

متجر البيانات التشغيلية

متجر البيانات التشغيلية (ODS) هو وحدة تخزين معلومات تعمل كوسيط بين مصادر البيانات ومستودع البيانات. يستخدم محللو البيانات متجر البيانات التشغيلية (ODS) في تقديم تقارير في الوقت الفعلي تقريبًا حول بيانات المعاملات. يدعم متجر البيانات التشغيلية (ODS) الاستعلامات البسيطة ويوفر كميةً محدودةً فقط من المعلومات. على سبيل المثال، قد يقوم متجر البيانات التشغيلية (ODS) بتخزين سجلات المبيعات فقط خلال الـ 12 ساعة الماضية. 

متجر البيانات Data mart مقابل متجر البيانات التشغيلية (ODS)

يستخرج متجر البيانات data mart معلوماتٍ موجهةً حسب الموضوع من مستودع بيانات، ولكن يقوم متجر البيانات التشغيلية (ODS) بإرسال المعلومات إلى مستودع البيانات للمعالجة. توفر متاجر البيانات معلوماتٍ تاريخيةً يمكنك تحليلها، ولكن يوفر متجر البيانات التشغيلية (ODS) طريقة عرض محدثة للعمليات الحالية. على سبيل المثال، يمكنك استخدام متجر البيانات data mart في تحديد أنماط المبيعات للربع الماضي ولكن يمكنك تلقي تحديثات أرقام المبيعات بالساعة من متجر البيانات التشغيلية (ODS). 

ما سبب أهمية متجر البيانات؟

فيما يلي بعض الأسباب الوجيهة التي قد تجعل الشركات تستخدم متجر بيانات data mart. 

استرجاع البيانات بشكل أكثر كفاءة

باستخدام متجر بيانات data mart، يمكن للشركات الوصول إلى معلومات محددة بشكل أكثر كفاءة. بالمقارنة مع مستودع البيانات، يحتوي متجر البيانات data mart على المعلومات ذات الصلة والتفصيلية التي يصل إليها القسم بشكل متكرر. ولذلك، لا يحتاج مديرو الأعمال إلى البحث في مستودع البيانات بالكامل لإنشاء تقارير الأداء أو الرسومات.

تبسيط اتخاذ القرار

يمكن للشركات إنشاء مجموعة فرعية من البيانات من مستودع بيانات باستخدام متجر بيانات. يمكن للموظفين داخل القسم بعد ذلك تحليل البيانات واتخاذ القرارات بناءً على نفس مجموعة المعلومات. 

التحكم في المعلومات بشكل أكثر فعالية

يمنح متجر البيانات الموظفين امتيازات وصول دقيقة للغاية. هذا يعني أنه يمكن للشركة تفويض شخص معين لعرض بيانات محددة أو استرجاعها. يساعد الشركات في تحسين حوكمة البيانات وفرض سياسات الوصول إلى المعلومات. على سبيل المثال، يمكنك استخدام متاجر البيانات في توفير وصول المستخدم للموظفين للحصول على معلومات معينة في مستودع بيانات.

المرونة في إدارة البيانات

متجر البيانات data mart يكون أصغر حجمًا ويحتوي على جداول أقل من مستودع البيانات. وهذا يعني أن مهندسي البيانات يمكنهم إدارة المعلومات وتغييرها في متجر البيانات بدون التسبب في تغييرات كبيرة في قاعدة البيانات.

ما كيفية عمل متجر البيانات data mart؟

يقوم متجر البيانات data mart بتحويل المعلومات الأولية إلى محتوى منظم وهادف لقسم معين من الأعمال. للقيام بذلك، قام مهندسو البيانات بإعداد متجر بيانات data mart لتلقي المعلومات إما من مستودع البيانات أو مباشرةً من مصادر بيانات خارجية. 

عندما يكون متصلاً بمستودع بيانات، يسترجع متجر البيانات data mart مجموعةً مختارةً من المعلومات ذات الصلة بوحدة أعمال. في كثير من الأحيان، تحتوي المعلومات على بيانات ملخصة وتستبعد البيانات غير الضرورية أو التفصيلية. 

الاستخراج والتحويل والتحميل (ETL)

الاستخراج والتحويل والتحميل (ETL) هي عملية لدمج ونقل المعلومات من مصادر البيانات المختلفة في قاعدة بيانات مادية واحدة. تستخدم متاجر البيانات عملية الاستخراج والتحويل والتحميل (ETL) لاسترجاع المعلومات من مصادر خارجية عندما لا تأتي من مستودع البيانات. تتضمن العملية الخطوات التالية.

  • الاستخراج: جمع المعلومات الأولية من مصادر مختلفة
  • التحويل: هيكلة المعلومات في تنسيق مشترك
  • التحميل: نقل البيانات التي تمت معالجتها إلى قاعدة البيانات

تقوم أدوات الاستخراج والتحويل والتحميل (ETL) بنسخ المعلومات من مصادر خارجية مثل جداول البيانات والتطبيقات والمستندات النصية. يقوم متجر البيانات data mart بعد ذلك بمعالجة المعلومات وتنظيمها وتخزينها في نموذج منظم. 

التحليلات

يستخدم محللو الأعمال أدوات برمجية لاسترجاع البيانات وتحليلها وتمثيلها من متجر البيانات. على سبيل المثال، يستخدمون المعلومات المخزنة في متاجر البيانات لتحليلات ذكاء الأعمال ولوحات معلومات التقارير والتطبيقات السحابية. 

كل متجر بيانات data mart يخدم عددًا صغيرًا من المستخدمين. على سبيل المثال، يمكن لمدير التسويق وكبار المسوقين الوصول إلى متجر بيانات data mart، ولذلك يستغرق الأمر وقتًا أقل لإنشاء التقارير والرسوم البيانية أو لإجراء تحليل تنبؤي.

ما أنواع متاجر البيانات؟

هذه هي الأنواع المختلفة من متاجر البيانات. 

متاجر البيانات التابعة

يقوم متجر البيانات data mart التابع بملء سعته التخزينية بمجموعة فرعية من المعلومات من مستودع بيانات مركزي. يقوم مستودع البيانات بتجميع كل المعلومات من مصادر البيانات. بعد ذلك، يستعلم متجر البيانات data mart ويسترجع المعلومات الخاصة بالموضوع من مستودع البيانات. 

المميزات والعيوب

يجري تنفيذ معظم أعمال إدارة البيانات والتحكم فيها في مستودع البيانات. وهذا يعني أن محللي الأعمال لا يلزمهم أن يكونوا على درجة عالية من المهارة في إدارة قواعد البيانات لاستخدام المعلومات من متجر البيانات. على الرغم من أن متاجر البيانات التابعة تجعل استرجاع المعلومات أسهل بكثير، إلا أنها تقدم نقطة فشل واحدة. إذا فشل مستودع البيانات، فستفشل جميع متاجر البيانات المتصلة أيضًا. 

متجر البيانات المستقل

لا يعتمد متجر البيانات المستقل على مستودع بيانات مركزي أو أي متجر بيانات آخر. يجمع كل متجر بيانات المعلومات من مصادره بدلاً من مستودع البيانات. تعد متاجر البيانات المستقلة مناسبةً للشركات الصغيرة، ولكن تحتاج أقسام محددة فقط إلى الوصول إلى المعلومات وتحليلها.

المميزات والعيوب

يمكن للشركات إعداد متاجر بيانات مستقلة بسهولة نسبية. ومع ذلك، فقد تكون إدارتها صعبة. وذلك لأن محللي الأعمال يحتاجون إلى أداء العمل الإداري لقاعدة البيانات في كل متجر بيانات data mart. من السهل مشاركة البيانات بين متاجر البيانات المختلفة باستخدام إستراتيجيات مثل مشاركة البيانات؛ يمكن للأقسام قراءة بيانات قسم آخر وحتى تعزيزها ببياناتها.  ومع ذلك، يجب وضع إستراتيجية قوية لفهرسة البيانات للتأكد من أن كل قسم يعرف ما يبحث عنه. 

متجر البيانات الهجين

تقوم متاجر البيانات الهجينة بجمع المعلومات من مستودع بيانات ومن مصادر خارجية. يتيح ذلك للشركات المرونة في اختبار مصادر البيانات المستقلة قبل توجيه البيانات إلى مستودع البيانات. 

على سبيل المثال، افترض أنك طرحت منتجًا جديدًا وتريد تحليل بيانات مبيعاته الأولية. يستخدم متجر البيانات data mart معلومات المبيعات التي تأتي مباشرةً من برنامج التجارة الإلكترونية ويسترجع سجلات المبيعات لمنتجات أخرى من متجر البيانات. بعد أن يصبح المنتج عنصرًا ثابتًا في متجرك، يمكنك توجيه تفاصيل المعاملة إلى مستودع البيانات.

ما هياكل متجر البيانات data mart؟

تستخدم متاجر البيانات هذه الهياكل في تخزين المعلومات وتمثيلها. 

النجمي

يحتوي الهيكل النجمي على جدول حقائق في المنتصف ويتفرع إلى عدة جداول أبعاد. ينتج عن هذا اتصال على شكل نجمة. جدول الحقائق هو جدول بيانات يحتوي على بيانات ملخصة يمكنك استخدامها في أغراض تحليلية. وفي الوقت نفسه، تحتوي جداول الأبعاد على معلومات وصفية في جدول حقائق. كل جدول أبعاد يرتبط بجدول الحقائق من خلال مفتاح خارجي. المفتاح الخارجي هو معرف فريد، مثل معرّف المنتج أو معرف المورّد. 

على سبيل المثال، يحتوي جدول الحقائق لمعاملات المبيعات على الأعمدة التالية:

  • معرف المبيعات
  • معرف المنتج
  • معرف المورّد
  • مبلغ المبيعات

يقوم جدول أبعاد المنتجات بتخزين المعلومات التالية:

  • معرف المنتج
  • اسم المنتج
  • تكلفة المنتج

يحتوي جدول أبعاد المورّد على الأعمدة التالية:

  • معرف المورّد
  • اسم المورّد
  • المدينة

المزايا

في الهيكل النجمي، يتم إلغاء تسوية جدول الأبعاد وبالتالي لا يمتد إلى جداول إضافية. وهذا يعني أن جدول الأبعاد قد يحتوي على بيانات زائدة عن الحاجة ولكنه يُحسّن سرعة البحث والاسترجاع. كما يستغرق مساحة أقل لتخزين جداول الأبعاد.

يمكن لمحللي الأعمال استخدام متجر بيانات ذي هيكل نجمي لجعل الاستعلامات المعقدة مباشرةً. عندما يبحثون عن سجل مبيعات معين، فإن نظام إدارة البيانات يبحث خلال جدول الحقائق. عندما يعثر نظام متجر البيانات على السجل الصحيح، فإنه يستخدم معرف المنتج ومعرف المورّد للاستعلام عن البيانات من جداول الأبعاد المعنية. 

بلا تسوية

يخزن الهيكل عديم التسوية جميع البيانات ذات الصلة في جدول واحد. ولا يوجد به وصلات معقدة بين جداول الحقائق وجداول الأبعاد. يستخدم محللو البيانات متجر بيانات بدون تسوية لأنه يحسن سرعة الاستعلام. على سبيل المثال، يتم البحث عن سجل مبيعات في جدول واحد بدون تسوية كما يلي:

  • معرف المبيعات
  • المنتج 
  • اسم المنتج
  • تكلفة المنتج
  • اسم النموذج
  • الوزن 
  • الحجم
  • المورّد 
  • اسم المورّد
  • المدينة
  • مبلغ المبيعات

يُعد متجر البيانات بدون تسوية مناسبًا لإعداد التقارير في الوقت الفعلي بسبب نهج الجدول الفردي. ومع ذلك، فإن إلغاء تسوية متجر البيانات data mart يؤدي إلى تكرار البيانات. على سبيل المثال، قد يظهر نفس اسم المنتج في سجلات متعددة. هذا يؤدي إلى مساحة تخزين إضافية وتكاليف تنفيذ باهظة الثمن.

ما خطوات تنفيذ متجر البيانات data mart؟ 

يقوم مهندسو البيانات السحابية بإعداد متجر البيانات data mart من خلال القيام بما يلي:

  1. تشغيل منصة البيانات الأصلية للسحابة الخاصة بهم.
  2. ملء متجر البيانات data mart ببيانات الأعمال. ضمان أن تكون البيانات بالتنسيق الصحيح وذات صلة بمستخدمي الأعمال.
  3. إعداد متجر البيانات data mart بحيث يمكن لعدة مستخدمين الوصول إلى البيانات منه. على سبيل المثال، يقومون بتثبيت لوحة معلومات لإعداد التقارير في متجر البيانات data mart. 
  4. الاستمرار في مراقبة المشكلات وتحسينها وحلها عند تشغيل متجر البيانات data mart.

كيف يمكنك تنفيذ متجر بيانات data mart على AWS؟

تحتاج الشركات إلى معالجة أحجام البيانات المتزايدة التي توسّع مساحة تخزين متجر البيانات data mart التقليدية إلى أقصى حد. يصعب توسعة متاجر البيانات المثبتة على الخوادم المحلية. توفر بنية السحابة قدرًا أكبر من التكامل وانخفاض التكلفة والقابلية للتوسع والقابلية للإدارة على مستوى المؤسسة مقارنةً بمتاجر البيانات.

Amazon Redshift هو حل لتخزين البيانات يمكنك استخدامه في تنفيذ متاجر بيانات في السحابة. يُمكنك الحصول على رؤى متكاملة بتشغيل التحليلات التنبؤية في الوقت الفعلي على البيانات المعقدة الموسعة عبر قواعد البيانات التشغيلية ومخزن البيانات ومستودع البيانات والآلاف من مجموعات البيانات التابعة لأطراف ثالثة. يمكنك إنشاء نماذج تعلم الآلة (ML) وتدريبها ونشرها تلقائيًا بسهولة. يمكنك إنشاء متاجر بيانات على Amazon Redshift واستخدامها لاتخاذ قرارات أكثر ذكاءً. 

يحتوي Amazon Redshift على بعض الميزات الأساسية التي تجعله حلاً رائعًا لمتجر البيانات data mart الخاص بك:

  • مع Amazon Redshift Serverless، يجري التعامل مع اعتبارات حجم المجموعة وتوسعتها نيابةً عنك. 
  • نظرًا لمشاركة البيانات الأصلية، يمكن للبيانات الموجودة في متجر البيانات data mart الخاص بك الوصول إلى البيانات الموجودة في مستودع البيانات الخاص بك أو يمكن مشاركتها في مستودع البيانات الخاص بك.

يمكنك البدء باستخدام متاجر البيانات data mart عن طريق إنشاء حساب AWS اليوم.

الخطوات التالية لمتجر البيانات Data Mart من AWS

التحقق من الموارد الإضافية المتعلقة بالمنتج
الاطلاع على عروض مجانية خاصة بخدمات التحليلات في السحابة 
تسجيل الاشتراك للحصول على حساب مجاني

تمتع بالوصول الفوري إلى الطبقة المجانية من AWS. 

تسجيل الاشتراك 
بدء إنشاء وحدة تحكم

البدء في بناء وحدة التحكم في إدارة AWS.

تسجيل الدخول