تعلم الآلةرؤية الحاسب

رؤية الحاسب

Computer Vision

قد يبدو العنوان غريباً بعض الشيء، فكيف يمكن للحاسب أن يرى؟! رؤية الحاسب (computer vision) هو مجالٌ يتكوّن من عدة تخصصاتٍ أهمها معالجة الصور (image processing) وتعلم الآلة (machine learning) التي هي فرع من الذكاء الاصطناعي، وتهدف رؤية الحاسب لمعالجة الصور آلياً لأداء مهام محددةٍ، كاكتشاف الأشياء في الصورة وتحديدها والتعرف عليها.

بالرغم من أن تسمية المجال جديدة على البعض، إلّا أنك تستخدمها بصورةٍ أو أخرى في حياتك اليومية الشخصية أو في العمل، فمن التطبيقات المنتشرة لرؤية الحاسب تقنيات التعرف على الأشخاص عن طريق سماتهم المميّزة، كبصمة الإصبع أو الوجه أو القزحية، ويُطلق على هذه الفئة من التطبيقات أنظمة القياس الحيوية، ولقد صارت تُستخدم يومياً في الجوالات وأنظمة الحضور والانصراف. وهناك حاجةٌ ماسةٌ في المجالات الطبية لتحليل الصور الطبية، كتلك المُلتقطة باستخدام الأشعة السينية أو الرنين المغناطيسي. وتُستخدم هذه الصور لتشخيص الأمراض والأورام والكسور، كما تستخدم للتخطيط للعمليات الجراحية عبر الوصول إلى دقة عاليةٍ ورؤية الأعضاء من الداخل. ويُستفاد من تحليل الصور في المصانع في العديد من المهام، كالتحقق من الجودة وتصنيف المنتجات حسب معايير محددة كالحجم أو اللون، وجرد المخزون والتوزيع عن طريق قراءة العناوين والرموز المكتوبة على العبوات. وهناك الكثير من المجالات غير ما ذكر، كالعسكرية، المرور، أنظمة الملاحة للطائرات، والتعرف على الكتابة المطبوعة وتحويلها إلى نصوصٍ في الحاسب.

قد يتبادر إلى الذهن أن التصوير عن طريق الكاميرات هو الوسيلة الوحيدة لإبصار الحاسب، سواء الفوتوغرافي أو الفيديو، ولكن الحاسب يستطيع الإبصار عن طريق العديد من وسائل التصوير المختلفة واقعاً. وهذه نقطة قوةٍ، حيث يُمكن التقاط الصور خلال أطوالٍ موجيةٍ مختلفةٍ من الطيف الكهرومغناطيسي (electromagnetic spectrum) أو عن طريق الأصوات أو الرنين المغناطيسي، وتتيح هذه الصور عرض خصائص الأجسام المصوّرة بطرقٍ مختلفةٍ لا يمكن للبشر رؤيتها بأعينهم. ويشغل الضوء المرئي (الذي نراه) جزءاً صغيراً جداً من الطيف الكهرومغناطيسي، كما هو مُوضح في الصورة التالية.

هذا المدى الصغير هو ما يستطيع الإنسان (وغالب الكاميرات الموجودة في الأسواق) أن يراه بعينه المجرّدة. بالرغم من أهميّة التقاط ومعالجة الصور في هذا المدى، إلّا أن العديد من المجالات والتطبيقات تتطلب التقاط الصور من خلال أطوال موجاتٍ كهرومغناطيسيةٍ أخرى، كالأشعة السينية (X-ray) لتصوير العظام، أو الأشعة فوق الحمراء (Infrared) للتصوير الحراري، أو صور مقرّبة جداً باستخدام مجهرٍ ضوئيٍ أو بعيدة باستخدام منظارٍ فلكيٍ، ويستلزم التقاط صور كهذه استخدام كاميراتٍ وأجهزةٍ مخصصةٍ لهذا الغرض. فيما يلي بعض الوسائل المستخدمة لالتقاط الصور وأمثلة على استخداماتها:

  • التصوير بالأشعة السينية: للتصوير الطبيّ للعظام ومراقبة الجودة في المصانع.
  • التصوير بالأشعة فوق الحمراء (التصوير الحراري): للكشف عن الاحتماء الزائد في المصانع والتمديدات الكهربائية، وكذلك للتصوير الليلي والتطبيقات الأمنية.
  • التصوير بالأقمار الصناعية: لمراقبة الطقس والأبحاث الجغرافية والبيئية وللأغراض العسكرية.
  • التصوير بالمناظير: لتصوير الكواكب والمجموعات الشمسية والمجرّات.
  • التصوير بالرنين المغناطيسي: ويستخدم لتصوير الأنسجة للأغراض الطبيّة.
  • التصوير بأشعة جاما: في التصوير الطبّي والتصوير الفضائي.
  • التصوير بالأشعة فوق البنفسجية: للتصوير الجنائي ومراقبة الجودة.
  • التصوير بالأشعة الفوق صوتية: ويستخدم في التصوير الطبّي كتصوير الجنين.
  • التصوير عن طريق المجهر: لفحص الخلايا والأنسجة عن قرب.
  • وطبعاً التصوير بالضوء المرئي.

توجد العديد من الخوارزميات في مجال رؤية الحاسب لتنفيذ مهام متنوعةٍ لتحليل الصور والاستفادة منها، فمثلاً يتطلب في بعض التطبيقات اكتشاف ما إذا كان هناك جسمٌ معينٌ في الصورة (Detection). وقد نحتاج لتتبع هذا الجسم أثناء حركته (Tracking)، ونحتاج أحياناً إلى اقتصاص هذا الجسم من الصورة بالتعرف على مكان حدوده بالضبط لقياس خصائص الأجسام المكتشفة (كالحجم والمحيط) (Segmentation). ومن المهام المستخدمة كثيراً أيضاً التعرف على الأجسام في الصورة (Recognition)، أو حتى مكونات الصورة بشكلٍ عامٍ (Scene Labeling). وتستفيد أنظمة الملاحة (Navigation) على اختلافها من رؤية الحاسب للتوجيه والملاحة وتحديد المكان (Localization) كالمستخدمة في الروبوتات والسيارات ذاتية القيادة، وتدخل كذلك في تطبيقات الواقع الافتراضي (Virtual Reality) والواقع المعزز (Augmented Reality).

مع انتشار تغطيات وسائل الإعلام للذكاء الاصطناعي، يخيل للشخص أحياناً مضاهاة الحاسب لقدرات الإنسان، ولكن يتبين البون الشاسع بين الحاسب والبشر فقط إذا أخذنا رؤية الحاسب لوحدها، حيث أن التحديات كثيرةٌ وصعبةٌ جداً. فكل الأمثلة التي ذكرتها تنتمي إلى مجالاتٍ محددةٍ، وعند تصميم هذه الخوارزميات يأخذ المجال بعين الاعتبار ما يُطلق عليه المعلومات المسبقة (prior knowledge)، فمثلاً عند تطوير تطبيقٍ طبي لمعالجة صورٍ مُلتقطة بالرنين المغناطيسي فإن من يقوم بتصميم الخوارزميات يعرف خصائص الصور والأنسجة الملتقطة ويضعها في الحسبان، وكذلك ينطبق المثل على الأنظمة الأخرى كالتعرف على الوجه أو النصوص. ولقد تحققت العديد من الإنجازات في الآونة الأخيرة، خصوصاً باستخدام خوارزميات التعلم العميق (deep learning) التي استفادت من الكم الهائل من الصور المتوفرة والإمكانيات الضخمة لمعالجتها، ولكن الطريق لا يزال طويلاً جداً لمقاربة الرؤية البشرية. وقد تحدث قفزاتٌ تقنيةٌ تغير المعادلة والتوقعات، فقد يُحدث تطوير الحوسبة الكميّة (quantum computing) قفزاتٍ هائلةٍ في سرعة وإمكانية التعلم للأجهزة على سبيل المثال. وتبقى بعد ذلك المسائل الفلسفية المتعلقة بطبيعة فهم الحاسب ومقارنتها بالإنسان، والتعريفات المتعلقة بالفهم والإدراك. وقد يكون من الأفضل هنا أن أتوقف وأن تطلق لخيالك العنان.

منقول من السعودي العلمي

اظهر المزيد

فارس القنيعير

‏‏‏‏‏‏‏‏‏‏‏‏‏مختص بالذكاء الاصطناعي، تعلم الآلة ورؤية الحاسب. مهتم بتحليل ومعالجة البيانات بشكل عام. ضمن خبراء جووجل في تعلم الآلة (ML GDE).

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى