Ali Ahmed55 نشر 6 نوفمبر 2024 أرسل تقرير نشر 6 نوفمبر 2024 السلام عليكم لو انا اتاكيدت ان القيمه الموجود في البيانات مش صحيح هل الافضل ان امسح والا الافضل ان استخدم الKNNImputer الموجود في مكتبه sklearn ؟ 1 اقتباس
0 Chihab Hedidi نشر 6 نوفمبر 2024 أرسل تقرير نشر 6 نوفمبر 2024 يعتمد هذا الأمر على نوع وطبيعة البيانات ومدى تكرار القيم الناقصة أو الخاطئة، فالحذف مفيد إذا كانت نسبة البيانات الخاطئة قليلة مقارنة بحجم البيانات بالكامل، و الحذف هنا يقلل من المخاطر التي قد تنجم عن التنبؤ الخاطئ أو القيم التقديرية غير الدقيقة، لكن إذا كانت البيانات المفقودة كبيرة أو تؤثر على عينة هامة، فقد يؤدي الحذف إلى تقليل تمثيل البيانات وبالتالي التأثير على النتائج النهائية للنموذج. أما KNNImputer يعمل عن طريق تقدير القيم المفقودة استنادا إلى الجيران الأقرب في البيانات، ويكون مناسبا إذا كانت البيانات المفقودة تعتمد إلى حد كبير على خصائص أخرى في البيانات، بينما قد يضيف بعض التعقيد الحسابي إذا كانت البيانات كبيرة جدا، وقد لا يكون مناسبا إذا كانت القيم الخاطئة لا يمكن التنبؤ بها بشكل جيد بناء على البيانات المحيطة. و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل. 1 اقتباس
0 Ali Ahmed55 نشر 6 نوفمبر 2024 الكاتب أرسل تقرير نشر 6 نوفمبر 2024 بتاريخ 3 دقائق مضت قال Chihab Hedidi: و يمكنك كذلك تجربة تقييم أداء النموذج بعد استخدام كل طريقة لمعرفة أيها يعطي نتائج أفضل. صح حضرتك معك حق تمام جدا الف شكراا لحضرتك اقتباس
السؤال
Ali Ahmed55
السلام عليكم
لو انا اتاكيدت ان القيمه الموجود في البيانات مش صحيح هل الافضل ان امسح والا الافضل ان استخدم الKNNImputer الموجود في مكتبه sklearn ؟
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.