اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

 أعتقد أنا ما تقصده بالتحيز هو bias. هذا المفهوم يمثل مدى بعد النموذج الحالي عن النموذج الصحيح.

أي لنفترض أننا نريد بناء نموذج يمكنه تمثيل العلاقات الخطية و لكن النموذج الحقيقي للبيانات هو قطع ناقص، عندها سيكون هناك bias عالي لأن النموذج الخاص بنا لا يستطيع تمثيل النموذج الحقيقي مهما تم تدريبه.

بينما في حال كان النموذج الحقيقي خطي و كان النموذج الخاص بنا هو كثير حدود polynomial من الرتبة الثانية أو حتى الثالثة، عندها لن يكون هناك bias و ذلك لأن النموذج الخاص بنا يستطيع تمثيل العلاقة الخطية ضمنيًا (عن طريق إسناد قيم صفرية للحدود ذو الرتب العليا و ترك فقط الحد الخطي من كثير الحدود). و لكن في تلك الحالة سيكون هناك variance عالي و غالبًا ستحصل مشكلة overfitting.

لذلك من الصعب معرفة أي الطريقتين أفضل بشكل مسبق، هذا يعتمد على البيانات التي لديك و ما هو توقعك لمدى تعقيد النموذج الحقيقي للبيانات (و هو أمر تصبح أفضل فيه مع الخبرة).

ما أستطيع تأكيده لك بشكل مسبق، هو أنه في حال كان لديك عدد قليل من البيانات فاستعمال الشبكات العصبية لن يكون جيدًا بشكل مؤكد، لأن هذه الشبكات غالبًا ما تحتوي على الكثير من البارامترات و لذلك تحتاج إلى بيانات كثيرة.

في حال وجود بيانات كثيرة فعندها يمكنك البدء بالخوارزميات التقليدية في حال أمكن تطبيقها لتأخذ فكرة عن الأداء الأدنى الذي يمكن تحقيقه خاصة أنه يمكن تدريب النماذج التقليدية بسرعة. و من ثم نقوم بزيادة تعقيد النموذج تدريجيًا حتى نحصل على نتائج جيدة.

بالمختصر، في حال كان الهدف فقط تقليل ال bias فزيادة تعقيد النموذج بشكل كبير جدًا ستقلل منه و لكن ذلك على حساب ال variance و بالتالي مشكلة ال overfittnig

تحياتي.

  • 0
نشر
بتاريخ 17 دقائق مضت قال Kais Hasan:

 أعتقد أنا ما تقصده بالتحيز هو bias. هذا المفهوم يمثل مدى بعد النموذج الحالي عن النموذج الصحيح.

أي لنفترض أننا نريد بناء نموذج يمكنه تمثيل العلاقات الخطية و لكن النموذج الحقيقي للبيانات هو قطع ناقص، عندها سيكون هناك bias عالي لأن النموذج الخاص بنا لا يستطيع تمثيل النموذج الحقيقي مهما تم تدريبه.

بينما في حال كان النموذج الحقيقي خطي و كان النموذج الخاص بنا هو كثير حدود polynomial من الرتبة الثانية أو حتى الثالثة، عندها لن يكون هناك bias و ذلك لأن النموذج الخاص بنا يستطيع تمثيل العلاقة الخطية ضمنيًا (عن طريق إسناد قيم صفرية للحدود ذو الرتب العليا و ترك فقط الحد الخطي من كثير الحدود). و لكن في تلك الحالة سيكون هناك variance عالي و غالبًا ستحصل مشكلة overfitting.

لذلك من الصعب معرفة أي الطريقتين أفضل بشكل مسبق، هذا يعتمد على البيانات التي لديك و ما هو توقعك لمدى تعقيد النموذج الحقيقي للبيانات (و هو أمر تصبح أفضل فيه مع الخبرة).

ما أستطيع تأكيده لك بشكل مسبق، هو أنه في حال كان لديك عدد قليل من البيانات فاستعمال الشبكات العصبية لن يكون جيدًا بشكل مؤكد، لأن هذه الشبكات غالبًا ما تحتوي على الكثير من البارامترات و لذلك تحتاج إلى بيانات كثيرة.

في حال وجود بيانات كثيرة فعندها يمكنك البدء بالخوارزميات التقليدية في حال أمكن تطبيقها لتأخذ فكرة عن الأداء الأدنى الذي يمكن تحقيقه خاصة أنه يمكن تدريب النماذج التقليدية بسرعة. و من ثم نقوم بزيادة تعقيد النموذج تدريجيًا حتى نحصل على نتائج جيدة.

بالمختصر، في حال كان الهدف فقط تقليل ال bias فزيادة تعقيد النموذج بشكل كبير جدًا ستقلل منه و لكن ذلك على حساب ال variance و بالتالي مشكلة ال overfittnig

تحياتي.

تمام

الف شكرااا جدا لحضرتك

جزاك الله كل خير

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...