اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

وعليكم السلام ورحمة الله وبركاته،

الشبكة العصبونية الالتفافية (CNN) تبنى من سلسلة من الطبقات، حيث يلعب كل منها دورا فريدا في معالجة وتعلم البيانات المرئية والطبقات الثلاث هي كالتالي:

بالنسبة للطبقات الالتفافية فالغرض منها هو استخراج المميزات من الصورة المدخلة بحيث تستخدم هذه الطبقات مرشحات قابلة للتعلم (أو نوى) تنزلق على الصورة المدخلة، حيث تحسب نواتج الضرب النقطي في كل موقع مكاني لإنشاء خرائط مميزة.

خطواتها كالآتي:

  • تلتقط الأنماط المحلية مثل الحواف والملمس أو البنى الأكثر تعقيدا.
  • تتكيف المرشحات المتعلمة أثناء عملية التدريب لتبرز أهم المميزات المتعلقة بالمهمة المطلوبة.

بالنسبة لطبقات التجميع (Pooling) فالهدف منها هو تقليل الأبعاد المكانية أي العرض والارتفاع لخرائط المميزات، مما يساعد على تقليل الحمل الحسابي والسيطرة على الإفراط في التعلم بحيث تقوم بتلخيص الاستجابات ضمن حي معين، غالبا باستخدام عمليات مثل التجميع الأقصى (Max Pooling) أو التجميع المتوسط (Average Pooling).

وخطواتها كالآتي:

  • تضيف درجة من عدم الحساسية للموقع الدقيق للمميزات في الصورة.
  • يقلل تقليل الأبعاد المكانية من التعقيد ويساعد في إنشاء تمثيلات أكثر تجريدا.

وأخيرا الطبقات المتصلة بالكامل (Fully Connected Layers) والغرض منها هو دمج المميزات التي تم تعلمها من الطبقات الالتفافية والتجميعية لأداء مهام التصنيف أو التقدير النهائية بحيث تحوّل المميزات عالية المستوى إلى متجه أحادي البعد.

أين تكون كل خلية عصبية في هذه الطبقة متصلة بكل خلية من الطبقة السابقة، مما يمكن الشبكة من تعلم تركيبات غير خطية معقدة للمميزات المستخرجة.

وهذه الطبقات معا تساعد CNN على تحويل البيانات الخام إلى تمثيل هرمي غني بالمميزات يستخدم بعد ذلك لاتخاذ قرارات دقيقة في المهام المختلفة.

  • 0
نشر

التلافيف هو العملية الأساسية التي يتم فيها تمرير مرشحات عبر الصورة لاستخراج الميزات المهمة مثل الحواف والأنماط، ثم يتم تطبيق التجميع Pooling لتقليل الأبعاد المكانية للصورة مع الاحتفاظ بأهم المعلومات، مما يقلل من الحسابات ويجعل النموذج أكثر كفاءة، و أكثر أنواع التجميع شيوعا هو التجميع الأعظمي، الذي يحتفظ بالقيم القصوى من كل منطقة مجمعة، وبعدها يتم تمرير الميزات المستخرجة عبر طبقة متصلة بالكاملFully Connected Layer، حيث يتم تحويلها إلى مصفوفة مسطحة تستخدم لاتخاذ القرارات النهائية، مثل تصنيف الصورة إلى الفئة الصحيحة.

  • 0
نشر

يمكنك تعريف ال Convolution Layer بشكل أبسط كالتالي:
هي الطبقة المسؤولة عن استخراج الميزات من الصورة المدخلة، مثل الحواف، الألوان، أو الأشكال. تستخدم مرشحات (filters) تمر على الصورة لتوليد خرائط ميزات (feature maps) تُظهر المناطق التي تحتوي على أنماط معينة.

وبالنسبة لPooling Layer فهي تُستخدم لتقليل الأبعاد المكانية لخرائط الميزات، مما يقلل من كمية الحسابات ويجعل الشبكة أكثر كفاءة. مثال على ذلك التجميع الأقصى (max pooling) الذي يأخذ القيمة الأكبر من كل منطقة في خريطة الميزات.

وأخيراً ال Fully Connected Layer
تأتي عادةً في نهاية الشبكة وتُستخدم لتصنيف الميزات التي تم استخراجها. و تسمح بدمج المعلومات لاتخاذ قرار نهائي، مثل تحديد ما إذا كانت الصورة تحتوي على قطة أو كلب.

  • 0
نشر
بتاريخ 2 ساعة قال عبدالباسط ابراهيم:

يمكنك تعريف ال Convolution Layer بشكل أبسط كالتالي:
هي الطبقة المسؤولة عن استخراج الميزات من الصورة المدخلة، مثل الحواف، الألوان، أو الأشكال. تستخدم مرشحات (filters) تمر على الصورة لتوليد خرائط ميزات (feature maps) تُظهر المناطق التي تحتوي على أنماط معينة.

وبالنسبة لPooling Layer فهي تُستخدم لتقليل الأبعاد المكانية لخرائط الميزات، مما يقلل من كمية الحسابات ويجعل الشبكة أكثر كفاءة. مثال على ذلك التجميع الأقصى (max pooling) الذي يأخذ القيمة الأكبر من كل منطقة في خريطة الميزات.

وأخيراً ال Fully Connected Layer
تأتي عادةً في نهاية الشبكة وتُستخدم لتصنيف الميزات التي تم استخراجها. و تسمح بدمج المعلومات لاتخاذ قرار نهائي، مثل تحديد ما إذا كانت الصورة تحتوي على قطة أو كلب.

الف شكراا جدا لحضرتك

جزاك الله كل خير

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...