Ail Ahmed نشر 6 نوفمبر أرسل تقرير نشر 6 نوفمبر السلام عليكم لو انا اتاكيدت ان القيمه الموجود في البيانات مش صحيح هل الافضل ان امسح والا الافضل ان استخدم الKNNImputer الموجود في مكتبه sklearn ؟ 1 اقتباس
0 Chihab Hedidi نشر 6 نوفمبر أرسل تقرير نشر 6 نوفمبر يعتمد هذا الأمر على نوع وطبيعة البيانات ومدى تكرار القيم الناقصة أو الخاطئة، فالحذف مفيد إذا كانت نسبة البيانات الخاطئة قليلة مقارنة بحجم البيانات بالكامل، و الحذف هنا يقلل من المخاطر التي قد تنجم عن التنبؤ الخاطئ أو القيم التقديرية غير الدقيقة، لكن إذا كانت البيانات المفقودة كبيرة أو تؤثر على عينة هامة، فقد يؤدي الحذف إلى تقليل تمثيل البيانات وبالتالي التأثير على النتائج النهائية للنموذج. أما KNNImputer يعمل عن طريق تقدير القيم المفقودة استنادا إلى الجيران الأقرب في البيانات، ويكون مناسبا إذا كانت البيانات المفقودة تعتمد إلى حد كبير على خصائص أخرى في البيانات، بينما قد يضيف بعض التعقيد الحسابي إذا كانت البيانات كبيرة جدا، وقد لا يكون مناسبا إذا كانت القيم الخاطئة لا يمكن التنبؤ بها بشكل جيد بناء على البيانات المحيطة. و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل. 1 اقتباس
0 Ail Ahmed نشر 6 نوفمبر الكاتب أرسل تقرير نشر 6 نوفمبر بتاريخ 3 دقائق مضت قال Chihab Hedidi: و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل. صح حضرتك معك حق تمام جدا الف شكراا لحضرتك اقتباس
السؤال
Ail Ahmed
السلام عليكم
لو انا اتاكيدت ان القيمه الموجود في البيانات مش صحيح هل الافضل ان امسح والا الافضل ان استخدم الKNNImputer الموجود في مكتبه sklearn ؟
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.