Ali Ahmed55 نشر 3 يونيو أرسل تقرير نشر 3 يونيو السلام عليكم هل الكود data_train.isna().sum() يتعرف على -1.0 علي انها قيمه مفقود والا الا ده بس بيتعرف علي NaN واي هو مفهوم الNaN يعني هو عبار عن القيمه في الصف مثل 3 فارغ مافهش حاجه يعني والا اي؟ 2 اقتباس
0 Mustafa Suleiman نشر 3 يونيو أرسل تقرير نشر 3 يونيو isna تتعرف على NaN و None وNaT (Not a Time - للتواريخ) كقيم مفقودة، ولا تعتبر -1.0 قيمة مفقودة بشكل افتراضي، حيث NaN هي قيمة خاصة تعني أنّ البيانات الرقمية مفقودة أو نتيجة عملية حسابية غير معرفة، بالتالي NaN في الغالب تعني أن الخلية كانت فارغة تمامًا في البيانات الأصلية، خصوصًا في الأعمدة الرقمية. ولتضمين قيم أخرى مثل -1.0 كقيم مفقودة، يجب تحديد ذلك صراحًة من خلال استبدالها عن طريق np.nan df.replace(-1.0, np.nan, inplace=True) أو إنشاء قناع مخصص: missing_mask = (df == -1.0) | df.isna() missing_count = missing_mask.sum() 1 اقتباس
0 Ali Ahmed55 نشر 3 يونيو الكاتب أرسل تقرير نشر 3 يونيو تمام جدا جدا الف شكراا جدا لحضرتكم جزاكم الله كل خير اقتباس
0 عبد الوهاب بومعراف نشر 3 يونيو أرسل تقرير نشر 3 يونيو وعليكم السلام ورحمة الله، يجب أن نفهم جيدا أن الشيفرة التالية: data_train.isna().sum() تستخدم في مكتبة Pandas لحساب عدد القيم المفقودة (missing values) في كل عمود من أعمدة DataFrame. ولكن من المهم أن نفهم أن هذا الكود لا يتعرف على القيمة -1.0 على أنها مفقودة، بل يتعرف فقط على القيم التي تم تمثيلها فعليا ك: اقتباس NaN (Not a Number) أو None في حالة البيانات من نوع float أو object. أي أنه وبمعنى آخر ف -1.0 هي قيمة عددية صالحة من وجهة نظر Pandas، حتى لو كانت تستخدم أحيانا كترميز يدوي للدلالة على نقص البيانات. أما NaN فهي ليست قيمة عددية، بل تمثل حالة غياب القيمة تماما، كأن تكون الخانة فارغة أو لا تحتوي على أي معلومة. لذا في حال ما إذا أردت أن تعتبر -1.0 قيمة مفقودة، فيجب أن تقوم بتحويلها صراحة إلى NaN باستخدام دالة مثل: replace(-1.0, np.nan) لأن مفهوم NaN يعني أن الخلية لا تحتوي على أي قيمة تستخدم في التحليل أو النمذجة، بعكس رقم مثل -1 أو 0 الذي يبقى رقما قابلا للتعامل معه ما لم يتم تحويله يدويا إلى NaN. 1 اقتباس
0 Ali Ahmed55 نشر 4 يونيو الكاتب أرسل تقرير نشر 4 يونيو الف شكراا جدا جدا لحضرتك حزاك الله كل خير اقتباس
السؤال
Ali Ahmed55
السلام عليكم
هل الكود data_train.isna().sum() يتعرف على -1.0 علي انها قيمه مفقود والا الا ده بس بيتعرف علي NaN واي هو مفهوم الNaN يعني هو عبار عن القيمه في الصف مثل 3 فارغ مافهش حاجه يعني والا اي؟
4 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.