اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

يعتمد حجم وعدد المرشحات على مدى تعقيد الصورة وتفاصيلها. بالنسبة للصور الصغيرة والبسيطة (مثل Mnist) ، ستحتاج إلى مرشحات 3x3 أو 5x5 وبعضها (4 ، ثم 8 ، حتى 16) لاكتشاف الخطوط المستقيمة والمنحنيات والأشكال المائلة وربما بعض درجات الألوان ؛ بينما بالنسبة للصور الأكبر (مثل الوجوه أو المناظر الطبيعية) ، قد تكون هناك حاجة إلى حقل تقبلي أكبر مع مرشحات 7 × 7 أو 9 × 9 أو 11 × 11 ، والبدء بـ 32 ثم 64 وما إلى ذلك لتمييز المزيد من الأشكال والأنسجة. ونستخدم مضاعفات العدد 2 لعدد المرشحات لأن المرشحات ترتبط بخرائط الميزات التي سيتم تسويتها في النهاية، لذلك فإن الأمر يتعلق بتنظيم ذاكرة الوصول العشوائي بشكل أفضل. أنا بالنسبة لقيم هذه المرشحات فالشبكات العصبية التلافيفية هي (عادةً) طرق خاضعة للإشراف للتعرف على الصور / الأشياء. هذا يعني أنك بحاجة إلى تدريب CNN باستخدام مجموعة من الصور المصنفة. وهذا يسمح بتحسين أوزان المرشحات التلافيفية، وبالتالي فإن المرشحات تشكل نفسها، بحيث تسعى لتقليل الخطأ. إذاً يمكنك تهيئتها بقيم عشوائية، والسماح للتعلم بالقيام بالعمل (خوارزمية Gradient descent). كما يمكنك بالطبع تعريف مرشحات بقيم محددة (اسخدام مرشحات مثل سوبل وغيره) لكن لاداعي لذلك.

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...