مقدمة عن تقسيم الصور (Image Segmentation)

رؤية الحاسب (Computer Vision) هو علم يختص بقدرة الحاسوب على فهم وتحليل الصور والفديوهات. وبصورة عامه محاولة محاكاة نظام الرؤية عند الانسان.

تستخدم تقنيات رؤية الحاسب في العديد من تطبيقات حياتنا اليومية بصورة كبيرة جداً، من كاميرات المراقبة (Security Cameras)، بصمة الوجه في الهاتف (Face ID)، التصوير الطبي (Medical Imaging) و الاكثر اذهالاً السيارة ذاتية القيادة (Self Driving Cars).

تقنيات رؤية الحاسب (Computer Vision Techniques)

تصنيف الصور (Image Classification)
تحديد الكائنات (Object Detection)
متابعة الكائنات (Object Tracking)
تقسيم الصور (Image Segmentation)

سنتعرض في هذا المقال مقدمة عن تقسيم الصور، إذا أردت تفاصيل أكثر عن بقية التقنيات اضغط على هذا الرابط.

تقسيم الصور (Image Segmentation)

استناداً على تعريف ويكيبيديا:

هي عملية تقسيم الصورة الرقمية إلى أجزاء أو مجموعة من البكسلات (أصغر وحدة في تكوين الصورة). الهدف من تقسيم الصورة إلى اجزاء هو تغيير تمثيلها وجعلها أبسط وأسهل للعمليات التحليلية.

استخدمات تقنية تقسم الصور عديدة جداً أشهرها في السيارة ذاتية القيادة كما توضح صورة المقال، تم تقسيم الناس باللون الأحمر والسيارات باللون الأرزق والطريق بلون بنفسجي، وغيرها. هذه التقسيمات تسهل على الحاسب أو البرنامج عملية تحليل الكائنات داخل الصورة أو الفديو.

بعض تقنيات تقسم الصور (Image Segmentation Techniques)

أسهل وأبسط طريقة لتقسيم الصور تسمى التقسيم الحدّي (Thresholding) نقوم فيها بتعرف قيمة معينة إذا تخطت قيمة البكسل ذاك الحد المعين نعطية القيمة 1 مثلاً، وقيم البكسل الأدنى تأخذ 0. ويكون المخرج الناتج صورة ثنائية في هذه الحالة، كما في الصورة الموضحة بالاسفل.

طريقة التجميع (Clustering Method).
خوارزميات التعلم العميق مثل: YOLO, Region Based Segmentation, U-Net سنتطرق لها في مقال آخر.

سنتحدث عن طريقة التجميع (Clustering Method)

عملية التجميع (Clustering) هي عملية تقسيم البيانات إلى مجموعات، بحيث كل مجموعة تحتوي عن بيانات متشابهة أو تمتلك صفات متشابهة. أشهر أنواع خوارزميات التجميع تعرف بـ K-Means.

الحرف K يمثل عدد المجموعات التي نريد تقسيمها. تعد خوارزمية K-Means إحدى أنواع خوارزميات التعلم غير موجَّه (Unsupervised Learning).

طريقة عمل خوارزمية K-Means

نحدد قيمة لـ K
نقوم بتوزيع البيانات (في حالة الصورة تكون بكسلات الصورة) على أي نقطة من النقاط K
نقوم بحساب نقطة المنتصف لكل من المجموعات (K)
نقوم بحساب المسافة لكل نقطة من البيانات إلى النقاط K
اعتماداً على المسافة المحسوبة نقوم بتوزيع نقاط البيانات على أقرب المجموعات لها
نقوم بحساب قيمة نقطة المنتصف من جديد
نكرر الخطوات 4، 5 و 6 إلى أن لا يحدث تغير كبير في قيمة نقطة المنتصف

لتنفيذ الخوارزمية سنتسخدم مكتبة OpenCV، وهي مكتبة متخصصة في برامج وخوارزميات رؤية الحاسب.

OpenCV تحتوي على دالة خاصة تنفذ k-means بعد أن تستقبل عدة متغيرات:

الصورة في شكل مصفوفة ثنائية الأبعاد
قيمة العدد K، أو قيمة المجموعات التي نريد تقسيمها
العلامات وقيمتها تكون None
شرط التوقف (criteria)
عدد المحاولات
اختيار نقطة المنتصف الأولى

شرح الدالة على موقع OpenCV.

الكود

‫

import cv2
import numpy as np
import matplotlib.pyplot as plt

# read the image
img = cv2.imread('../caf.jpg')

# make a copy
img_copy = np.copy(img)

# convert it to RGB
img_copy = cv2.cvtColor(img_copy, cv2.COLOR_BGR2RGB)

# reshape it to 2D array to feed it to kmean
pixel_vals = img_copy.reshape((-1, 3))
pixel_vals = np.float32(pixel_vals)

# define stopping criteria
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)

# number of clusters
k = 3
# try to change the number of k to see different result
# perform kmean
retval, labels, centers = cv2.kmeans(pixel_vals, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)

# convert data into 8-bit values
centers = np.uint8(centers)
segmented_data = centers[labels.flatten()]

#reshape the data to the original shape
segmented_image = segmented_data.reshape((img_copy.shape))
labels_reshape = labels.reshape(img_copy.shape[0], img_copy.shape[1])

# show the images
plt.subplot(121),plt.imshow(img_copy)
plt.title('Original Image'), plt.xticks([]), plt.yticks([])

plt.subplot(122),plt.imshow(segmented_image)
plt.title('Segmented Image K'), plt.xticks([]), plt.yticks([])

plt.show()

المصادر

مرتبط

الوسوم

Mohammed Galalen 21 أبريل، 2019

6 2 دقائق

اظهر المزيد

‫6 تعليقات

يقول Malak:

28 أبريل، 2019 الساعة 9:20 م

ماهو المقصود بصورة ثنائية (ويكون المخرج الناتج صورة ثنائية في هذه الحالة، كما في الصورة الموضحة بالاسفل.)

رد
1. يقول Mohammed Galalen:
  
  29 أبريل، 2019 الساعة 5:40 م
  
  هي الصورة المكونة من ابيض واسود
  
  رد
  1. يقول ضياء صادق:
    
    15 مارس، 2020 الساعة 7:03 م
    
    السلام عليكم ممكن اعرف كيف يتم تجزئة الصورة أستخدم فضاء الألوان
    
    رد
يقول Malak:

30 أبريل، 2019 الساعة 7:58 ص

شكرا لك الشرح جدا واضح ، هل من الممكن شرح YOLO: Real-Time Object Detection بطريقه مفصله ؟

رد
1. يقول Mohammed Galalen:
  
  30 أبريل، 2019 الساعة 9:33 ص
  
  تسلم، ان شاء الله في مقال قادم.
  
  رد
يقول ضياء صادق:

15 مارس، 2020 الساعة 7:05 م

ياريت تجاوب لان موضوع بحث هذا ومااعرف كيف يتم تجزئة الصورةب أستخدم فضاء الألوان في الماتلاب

رد

اترك تعليقاً إلغاء الرد

محمدعبدالله هتان
حذف كل الارتبطات الخاريه الابويه من جميع البرامج وتطبيقات وا...
محمد
What is a claim: stating something to be true when it is sti...
أبو عبد الرحمن
موضوع مفيد جداً جزاك الله خيراً سؤال تكرماً: ما الأنواع المد...
اصيل السيلاوي
شكرا لكم...
اصيل السيلاوي
شكرا لكم شرح وافي جدا...

مقدمة عن تقسيم الصور (Image Segmentation)

تقنيات رؤية الحاسب (Computer Vision Techniques)

تقسيم الصور (Image Segmentation)

بعض تقنيات تقسم الصور (Image Segmentation Techniques)