اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

يعتمد هذا الأمر على نوع وطبيعة البيانات ومدى تكرار القيم الناقصة أو الخاطئة، فالحذف مفيد إذا كانت نسبة البيانات الخاطئة قليلة مقارنة بحجم البيانات بالكامل، و الحذف هنا يقلل من المخاطر التي قد تنجم عن التنبؤ الخاطئ أو القيم التقديرية غير الدقيقة، لكن إذا كانت البيانات المفقودة كبيرة أو تؤثر على عينة هامة، فقد يؤدي الحذف إلى تقليل تمثيل البيانات وبالتالي التأثير على النتائج النهائية للنموذج.

أما KNNImputer يعمل عن طريق تقدير القيم المفقودة استنادا إلى الجيران الأقرب في البيانات، ويكون مناسبا إذا كانت البيانات المفقودة تعتمد إلى حد كبير على خصائص أخرى في البيانات، بينما قد يضيف بعض التعقيد الحسابي إذا كانت البيانات كبيرة جدا، وقد لا يكون مناسبا إذا كانت القيم الخاطئة لا يمكن التنبؤ بها بشكل جيد بناء على البيانات المحيطة.

و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل.

  • 0
نشر
بتاريخ 3 دقائق مضت قال Chihab Hedidi:

و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل.

صح حضرتك معك حق 

تمام جدا

الف شكراا لحضرتك

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...