اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر
بتاريخ 25 دقائق مضت قال Ali Ahmed55:

ايوه بظبط مافيش قيمه خالص في الخانه

يمكنك أولا تحويل قيم السلاسل النصية الفارغة إلى قيمة Nan كالتالي :

df['my_column'].replace('', None, inplace=True)

وتأكد من كتابة إسم العمود الذي توجد به القيم الفارغة .

بعد ذلك يمكنك حذف القيم الفارفة كاملة من خلال الدالة dropna كالتالي:

df.dropna() 

أو إذا أردت تلقائيا إعتبار القيمة na عند قراءة البيانات من الملف يمكنك إستخدام التالي :

data = pd.read_csv('data.csv', na_values=[''])

وبعد ذلك يمكنك إستخدام dropna

  • 0
نشر
بتاريخ 9 دقائق مضت قال محمد عاطف17:

أو إذا أردت تلقائيا إعتبار القيمة na عند قراءة البيانات من الملف يمكنك إستخدام التالي :

 

يعني اي معليش ؟

وكمان هو ليه قيمه None مش ظهر هنا في الكود ده

data_train['cyto_score'].replace('' , None , inplace=True)
cyto_score = data_train['cyto_score'].value_counts()
print(cyto_score)

 

دي النتحيه 

Poor            8802
Intermediate    6376
Favorable       3011
TBD             1341
Normal           643
Other            504
Not tested        55

 

  • 0
نشر
بتاريخ 6 دقائق مضت قال Ali Ahmed55:

يعني اي معليش ؟

أى عند قراءة البيانات من الملف ستقوم المكتبة بإعتبار أى قيمة وضعتها في المعامل na_values ستكون قيمة فارغة وسيتم حذفها إذا تم إستخدام dropna .

فمثلا لو لدينا البيناات التالية في ملف ال csv :

Name    ,   Age  ,   City
Ahmed   ,   25   ,   Cairo
        ,   30   ,  Alexandria
Mohammed,        ,   Riyadh
Sami    ,   22   ,

لاحظ أنه يوجد الكثير من الحقول فارغة أى قيمة نصية "" وعند إستخدام الكود الذي وضحته لك وهو :

import pandas as pd

# قراءة الملف مع اعتبار القيم الفارغة كسلسلة فارغة كـ NaN
df = pd.read_csv('data.csv', na_values=[''])

print(df)

ستكون البيانات كالتالي :

      Name   Age         City
0    Ahmed  25.0        Cairo
1     NaN  30.0  Alexandria
2  Mohammed   NaN       Riyadh
3    Sami  22.0          NaN

لاحظ كيف أن القيم الفارغة أصبحت ب Nan وهكذا عند إستخدام الدالة dropna سيتم حذف تلك القيم.

  • 0
نشر

الف شكراا جدا لحضرتك

جزاك الله كل خير

بس ليه القيمه NaN مش ظهر 

بتاريخ 23 دقائق مضت قال Ali Ahmed55:

 

وكمان هو ليه قيمه None مش ظهر هنا في الكود ده

data_train['cyto_score'].replace('' , None , inplace=True)
cyto_score = data_train['cyto_score'].value_counts()
print(cyto_score)

 

دي النتحيه 

Poor            8802
Intermediate    6376
Favorable       3011
TBD             1341
Normal           643
Other            504
Not tested        55

 

  • 0
نشر
بتاريخ 1 ساعة قال Ali Ahmed55:

بس ليه القيمه NaN مش ظهر 

لاحظ البيانات التي أرسلتها . لا يوجد بها أى قيمة فارغة . ولهذا لا يتم إستبدال القيم ب NaN .

Poor            8802
Intermediate    6376
Favorable       3011
TBD             1341
Normal           643
Other            504
Not tested        55

هل يمكنك توضيح ما هي القيم التي تظن أنها فارغة في البيانات السابقة التي أرسلتها ؟ أعتقد أن جميع البيانات موجودة ولا توجد أى قيمة أو حقل فارغ.

فقط يتم إستبدال الخانات أو الحقول الفارغة ب NaN

  • 0
نشر
بتاريخ 19 ساعة قال محمد عاطف17:

لاحظ البيانات التي أرسلتها . لا يوجد بها أى قيمة فارغة . ولهذا لا يتم إستبدال القيم ب NaN .

Poor            8802
Intermediate    6376
Favorable       3011
TBD             1341
Normal           643
Other            504
Not tested        55

هل يمكنك توضيح ما هي القيم التي تظن أنها فارغة في البيانات السابقة التي أرسلتها ؟ أعتقد أن جميع البيانات موجودة ولا توجد أى قيمة أو حقل فارغ.

فقط يتم إستبدال الخانات أو الحقول الفارغة ب NaN

الا فيه قيمه مفقود بس الدالة value_counts() تتجاهل القيم المفقودة (NaN) افتراضيًا.

لا تعرض الدالة value_counts() القيم المفقودة (NaN) افتراضيًا. لجعلها تظهر، استخدم dropna=False:

 

الف شكرااا لحضرتك جدا

جزاك الله كل خير

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...