اذهب إلى المحتوى

Ali Ahmed55

الأعضاء
  • المساهمات

    1884
  • تاريخ الانضمام

  • تاريخ آخر زيارة

  • عدد الأيام التي تصدر بها

    14

كل منشورات العضو Ali Ahmed55

  1. السلام عليكم هو لو انا مسحت حوالي 90% من البيانات بسيب الnulls تاثير ده اي علي نموذج ؟
  2. الف شكرااا جدا جدا لحضرتك جزاك الله كل خير
  3. السلام عليكم انا هنا في الكود ده عاوز 1- امسح القيمه الNaN ماعد اعمده معين # Select columns that are important for further analysis, focusing on those that may contain missing values data_columns_nulls = data_train[['cyto_score','cyto_score_detail','hla_high_res_6','hla_high_res_8','hla_high_res_10','hla_match_b_high','tce_imm_match','mrd_hct','tce_match','tce_div_match']] # Drop rows with NaN values in columns that are not part of the selected ones # Commented line below would remove any rows with NaN values, but we're handling missing data per column #data_train.dropna(inplace=True) for columns in data_train.columns: if columns not in data_columns_nulls.columns: # Drop rows where the selected column has NaN values data_train = data_train.dropna(subset=[columns]) # Calculate and print the total number of missing values per column (if needed) missing_values = data_train.isna().sum() print(missing_values) ودي نتجيه الmissing_values ID 0 dri_score 0 psych_disturb 0 cyto_score 2491 diabetes 0 hla_match_c_high 0 hla_high_res_8 60 tbi_status 0 arrhythmia 0 hla_low_res_6 0 graft_type 0 vent_hist 0 renal_issue 0 pulm_severe 0 prim_disease_hct 0 hla_high_res_6 60 cmv_status 0 hla_high_res_10 60 hla_match_dqb1_high 0 tce_imm_match 2468 hla_nmdp_6 0 hla_match_c_low 0 rituximab 0 hla_match_drb1_low 0 hla_match_dqb1_low 0 prod_type 0 cyto_score_detail 4105 conditioning_intensity 0 ethnicity 0 year_hct 0 obesity 0 mrd_hct 5884 in_vivo_tcd 0 tce_match 6306 hla_match_a_high 0 hepatic_severe 0 donor_age 0 prior_tumor 0 hla_match_b_low 0 peptic_ulcer 0 age_at_hct 0 hla_match_a_low 0 gvhd_proph 0 rheum_issue 0 sex_match 0 hla_match_b_high 60 race_group 0 comorbidity_score 0 karnofsky_score 0 hepatic_mild 0 tce_div_match 2536 donor_related 0 melphalan_dose 0 hla_low_res_8 0 cardiac 0 hla_match_drb1_high 0 pulm_moderate 0 hla_low_res_10 0 efs 0 efs_time 0 dtype: int64 لحد دلوقتي تمام بعد كده 2- املئ القيمه الNaN في الاعمدا المعين التي لم امسحها # Fill missing values in the columns selected for analysis for columns in data_columns_nulls.columns: # For categorical columns (object type), fill NaN with the most frequent value (mode) if data_train[columns].dtype == 'object': data_train[columns].fillna(data_train[columns].mode()[0]) else: # For numerical columns, fill NaN with the mean of the column data_train[columns].fillna(data_train[columns].mean()) print("-" * 20) # Calculate and print the total number of missing values per column (if needed) missing_values = data_train.isna().sum() print(missing_values) نتجه الmissing_values زي الاول بطبظ طيب ازي مش المفروض يكون كلها اصفر ID 0 dri_score 0 psych_disturb 0 cyto_score 2491 diabetes 0 hla_match_c_high 0 hla_high_res_8 60 tbi_status 0 arrhythmia 0 hla_low_res_6 0 graft_type 0 vent_hist 0 renal_issue 0 pulm_severe 0 prim_disease_hct 0 hla_high_res_6 60 cmv_status 0 hla_high_res_10 60 hla_match_dqb1_high 0 tce_imm_match 2468 hla_nmdp_6 0 hla_match_c_low 0 rituximab 0 hla_match_drb1_low 0 hla_match_dqb1_low 0 prod_type 0 cyto_score_detail 4105 conditioning_intensity 0 ethnicity 0 year_hct 0 obesity 0 mrd_hct 5884 in_vivo_tcd 0 tce_match 6306 hla_match_a_high 0 hepatic_severe 0 donor_age 0 prior_tumor 0 hla_match_b_low 0 peptic_ulcer 0 age_at_hct 0 hla_match_a_low 0 gvhd_proph 0 rheum_issue 0 sex_match 0 hla_match_b_high 60 race_group 0 comorbidity_score 0 karnofsky_score 0 hepatic_mild 0 tce_div_match 2536 donor_related 0 melphalan_dose 0 hla_low_res_8 0 cardiac 0 hla_match_drb1_high 0 pulm_moderate 0 hla_low_res_10 0 efs 0 efs_time 0
  4. السلام عليكم هو اي اهميه الاشتقاق والجبر الخطي في الشبكات العصبيه من ناحيه المطورين يعني انا هستخدم ادوات جاهز ؟ يعني فين الاابدع ؟
  5. ايوه بس فيه مشكله هو ان القيمه عبار عن نص مش ارقم يعني الازم الاوال استخدم الLabelEncoder و بعد كده احساب المتوسط وبعد كده إستبدال تلك القيم بس ازي بقا اقدر ان امسح القيمه الNaN في باقي الاعمده الا انا هعمل كده في ا4 اعمده فقط ؟
  6. السلام عليكم ده الكود data_columns_nulls = data_train[['cyto_score','cyto_score_detail','hla_high_res_6','hla_high_res_8','hla_high_res_10']] for columns in data_columns_nulls.columns: mean = data_train[columns].mean() print(f'{columns}: {mean}') ودي الخطاء TypeError: unsupported operand type(s) for +: 'int' and 'str'
  7. السلام عليكم هو لو عندي قيم NaN ومسحتها هل اقدر بعد كده ان احساب المتوسط و اعوض القيمه الا انا مسحتها ؟
  8. اه عشان مصممش نموذج خاص بالبيانات دي فقط تمام الف شكرااا جدا جدا لحضرتك يا أ.قيس والله الف شكرااا جزاك الله كل خير
  9. انا اقصد مسابقه CIBMTR - Equity in post-HCT Survival Predictions عليها جويز ماليه
  10. السلام عليكم فيه مسابقه في كاغل بيانات الاختبار قليل جدا جدا 4 صفوف فقط الا غير هل فيه تفسير ؟
  11. السلام عليكم هو اي الاستفاد من ان اكتب كود لشبكه عصبيه من الصفر في المشاريع الحقيقي بدل استخدم الاوات الجاهز ؟
  12. السلام عليكم لماذا يُعتبر الانحدار اللوجستي في الأساس شبكة عصبية بسيطة جدًا ؟
  13. السلام عليكم فيه حاجه غريب جدا في الكود ده هو ازي مش بيمسح القيمه الفارغ هي عبار عن دي ' ' ؟ ده الكود na_value = ['','Not tested' , 'Not done' , 'Other' , 'TBD cytogenetics' , 'N/A - disease not classifiable' , 'TBD', 'TBI +- Other, unknown dose' , 'N/A, F(pre-TED) not submitted' , 'No drugs reported'] data_train = pd.read_csv("equity-post-HCT-survival-predictions/train.csv" , na_values=na_value) ودي النتجيه (28800, 60) (1654, 60) و لو شلت ال ' ' من تغير الna_value بتكون بردو زي ماهي طيب ازي مع ان فيه قيمه null كثير زي دي
  14. السلام عليكم هو مسح صفوف كثير بسيب ان فيه بيانات مفقود مش ده ممكن يسبيب تحيزه اثناء تدريب النموذح وكمان مش ممكن ياثير علي تحليل البيانات دي ؟
  15. حتي لو كانت مسابقه علي كاغل فيه جوايز ماليه ؟ يعني مش ممكن هما يستخدمو النموذج علي 11 بدل 10
  16. السلام عليكم هو لو فيه عمود انا مسحتو في بيانات التدريب هل يفضل بردو امسحو من بيانات الاختبار ؟ مع العلم انا العمود في بيانات التدريب فيه بيانات ناقصه كثير جدا جدا عشان كده انا مسحتو العمود عكس بقا في بيانات الاختبار واي تاثير ده علي النموذج لو انا ممسحتش العمود في الاختبار ؟
  17. اه عشان كده الناس كتبني النموذج فقط من غير تحليل البيانات الف شكرااا جدا جدا لحضرتكم
  18. السلام عليكم في مسابقات Kaggle التي تقدم جوائز مالية هل يتم مراجعت الكود ككل والا جزاء معين من الكود فقط ؟
  19. الف شكرااا لحضرتك جدا
×
×
  • أضف...