مقالات

رسالة لمن اختزل إدارة البيانات في علم البيانات

يعتقد الكثير من المهتمين بإدارة البيانات أن عالم البيانات هي المهنة الوحيدة في هذا المجال وهذا خطأ شائع. إن مجال إدارة البيانات مجال أكبر بكثير من ذلك. كما في هذه الشريحة

إدارة البيانات هي خليط من عدة تخصصات الحاسب الآلي والإحصاء وعلم المعلومات وغيرها، حسب مجال مشروع إدارة البيانات. والحقيقة كل الحقيقة إذا قسمنا عدد فريق إدارة البيانات بالمسميات الوظيفية وعدد كل وظيفة نجد أن التقنيين هم الأوفر حظاً وليس علماء البيانات.

نحن في إدارة البيانات نقسم العمل إلى شقين، أحدهما نطلق عليه الأعمال (Business) والآخر التقنية (Technical).

قطاع الأعمال Business

  1. محلل أعمال: يقوم بفهم طلبات العميل ودراسة الأنظمة القائمة والبيانات ومصادرها. وهي تقريباً نفس عمل محلل الاعمال في قطاع البرمجيات إلا أنه يكون لديه خبرة بالتعامل مع البيانات ومتخذي القرار. ويساعد كثيراً في تصحيح البيانات بسبب فهمه لقواعد الأنظمة.
  2. عالم البيانات: يقوم بدراسة مجال البيانات المستهدفة (صحة، فلك، مالية …) ثم يقوم مع فريق عمله على تحديد الأسئلة والمؤشرات التي سيبحث لها عن جواب في البيانات، وهي عملية أشبه بكتابة أسئلة بحث علمي، ثم التأكد من أنها تتوفر إجابة لها. وعالم البيانات هو قائد فريق من محللين البيانات. ويقوم في مرحلة لاحقة باختيار الخوارزميات التي سيستخدمها أو إنشاء خوارزمية جديدة.
  3. محلل البيانات: يتم تقسيم البيانات إلى ما نسميه Subject Area وكتابة الأسئلة أو ما نسميه مؤشر (Indicator)، ثم تحديد كيفية الإجابة عليه وماهي المعادلة التي توصل إلى النتيجة، واسم قاعدة البيانات والجداول والحقول التي سيتم استخراج البيانات منها، وغيرها من البيانات. مثال:
    1. المؤشر: كم تبلغ أعداد الموظفين حسب الجنس
    2. قاعدة البيانات: شؤون الموظفين
    3. الجدول: Employees
    4. الحقول: EmployeeID, Gender
    5. المعادلة: عدد الموظفين / الجنس

وهذا صورة مجتزأة لا تظهر كل الحقول ومن وثيقة فعلية:

بالعادة، نحن كشركة تقنية لا نوظف هؤلاء. إما ان نستعين بشركات استشارية أو نتعاقد بشكل مؤقت معهم.

قطاع التقنية Technical

هم من يدرسوا الوضع التقني واحتياجات الربط بمصادر التقنية (Integration)، بناء التجهيزات (Hardware) والبرمجيات (Software)، إنشاء ملفاتETL، وبناء مستودعات البيانات (Data warehouse)، وبناء نظام هدوب (Hadoop) -إذا كانت من المتطلبات، وبناء OLAP، وبناء لوحات المعلومات (Dashboards). مع تحديد فترات التحديث للبيانات ومراقبة الأنظمة وإعطاء الصلاحيات. ثم تشغيل المشروع.

سنستعرض المزيد من هذه المفاهيم والتخصصات في مقالات أخرى مستقبلاً.

الوسوم
اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

إغلاق