المشاركات

الارتباط الخطي المتعدد (Multiple Linear Regression)

شرحت في الدرس السابق الارتباط الخطي (Linear Regression)، وكيف تم استخدامه لوصف العلاقة بين متغيرين: مساحة المنزل والسعر. ولكن في التطبيقات الحقيقية من النادر أن نستطيع توقع السعر باستخدام أحد الخصائص فقط (مساحة المنزل)، نحتاج للعديد من الخصائص لنصل إلى قدر معقول من الدقة. من الممكن عمل ذلك باستخدام الارتباط الخطي المتعدد (Multiple Linear Regression)، موضوع هذا الدرس.

لنفترض أننا سنستخدم مساحة المنزل وعدد الغرف لتقدير السعر، حينها ستصبح معادلة الخط المستقيم معادلة مستوي مثل:

\hat{y}=w_0+w_1x_1+w_2x_2

ويمكن استعراض المستوي في الشكل التالي:

نلاحظ أننا انتقلنا من بعدين إلى ثلاثة أبعاد، وكلما ازدادت الخصائص ستزداد الأبعاد. لا يمكن رسم الأشكال إذا تجاوزت الثلاثة أبعاد، ولكن نستطيع تمثيلها رياضياً، والشكل الناتج يطلق عليه المستوي الفائق (hyperplane). لنفترض أن لدينا العديد من الخصائص الآن: حجم المنزل، عدد الغرف، عدد دورات المياه، المدينة، الحي، …، وغيرها. نستطيع تمثيلها في المعادلة التالية:

\hat{y}=w_0+w_1x_1+w_2x_2+w_3x_3+\cdots +w_nx_n

حيث n هي عدد الخصائص (features). ويمكن كتابة المعادلة باستخدام المتجهات

\hat{y}=\mathbf{w}^T \mathbf{x}

هذه مراجعة سريعة للتعامل مع المتجهات والمصفوفات لتنشيط الذاكرة.

يتم بناء النموذج بنفس الطريقة التي تم شرحها في درس الارتباط الخطي عن طريق التحسين (optimization)، ولكن هنا نحتاج أن نبحث عن قيم أكثر. هذه المعادلة لتحديث قيم w (المعادلة باستخدام متجهات)

 \mathbf{w}^{t+1} = \mathbf{w}^t - \eta \nabla RSS

ولكن هنا عدد القيم أكثر من السابق، كما هو موضح في المعادلة (بدون صيغة المتجهات للتوضيح)

 \begin{bmatrix} w_0^{t+1} \\ w_1^{t+1} \\ w_2^{t+1} \\ . \\ . \\ . \\ w_n^{t+1} \end{bmatrix} = \begin{bmatrix} w_0^{t} \\ w_1^{t} \\ w_2^{t} \\ . \\ . \\ . \\ w_n^{t} \end{bmatrix} -\eta \begin{bmatrix} -2\sum_{i=1}^N [\hat{y^{(i)}}-y^{(i)}] \\ -2\sum_{i=1}^N [\hat{y^{(i)}}-y^{(i)}]x^{(i)}_1 \\ -2\sum_{i=1}^N [\hat{y^{(i)}}-y^{(i)}]x^{(i)}_2 \\ . \\ . \\ . \\ \\ -2\sum_{i=1}^N [\hat{y^{(i)}}-y^{(i)}]x^{(i)}_n \end{bmatrix}

بعد أن ننتهي من تدريب النموذج نستطيع استخدامه. فمثلاً لتقدير أسعار المنازل، لنفترض أن لدينا ثلاثة خصائص: مساحة البيت (x_1)، عدد الغرف (x_2)، الحي (x_3)، نستطيع عمل ذلك عن طريق المعادلة التالية:

\hat{y}=w_0+w_1x_1+w_2x_2+w_3x_3

بشكل عام، مفهوم الارتباط الخطي المتعدد قريب جداً للارتباط الخطي، الاختلاف فقط أننا هنا نستخدم خصائص أكثر.

في الكثير من الحالات لا يمكن تمثيل البيانات باستخدام نموذج خطي، هنا نحتاج أن نستخدم النماذج الغير خطية (non-linear models). في الدرس القادم إن شاء الله سأتحدث عن الارتباط الغير خطي (non-linear regression).

آمل أن يكون الموضوع واضحاً، وأرحب بأي سؤال أو إضافة.

الوسوم
اظهر المزيد

فارس القنيعير

أستاذ بحث مساعد. مختص بتعلم الآلة ورؤية الحاسب، ومهتم بتحليل ومعالجة البيانات بشكل عام.

مقالات ذات صلة

3 آراء على “الارتباط الخطي المتعدد (Multiple Linear Regression)”

    1. عفواً، وإياك.
      إذا فتحت صفحة المراجعة السريعة في الجوال ستظهر هذه الرسالة لأنه ملف pdf، أعتقد متصفح الجوال لا يدعم عرضه داخل الصفحة. يوجد زر تحميل في الصفحة لتحميل الملف وفتحه. إذا فتحت الصفحة في متصفح الحاسب سيفتح لك الملف داخل الصفحة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

شاهد أيضاً

إغلاق
إغلاق