اذهب إلى المحتوى

Mohammad Ibrahim8

الأعضاء
  • المساهمات

    2
  • تاريخ الانضمام

  • تاريخ آخر زيارة

إنجازات Mohammad Ibrahim8

عضو مبتدئ

عضو مبتدئ (1/3)

2

السمعة بالموقع

  1. في الكود الاول يتم التعامل مع المتغيرات كما هي (سواء كانت رقمية أو فئوية ( Categorical )) واذا كانت بعض هذه المتغيرات فئوية فيجب تحويلها مسبقًا باستخدام pd.get_dummies أو LabelEncoder، لكي يتعامل معها النموذج بشكل صحيح . اما في الكود الثاني يتم استخدام الصياغة المعتمدة على formula وهي الطريقه الافضل C(variable_name) تعني أن المتغيرات cyto_score, tbi_status, و graft_type فئوية (Categorical)، مما يعني أن المكتبة ستحولها تلقائيًا دون الحاجة الي تحويلها مسبقا . المتغير vent_hist لم يتم وضعه داخل C(), مما يعني أنه متغير عددي ولن يتم تحويله. الفرق بين الكودين : الكود الأول لا يتعامل مع المتغيرات الفئوية بشكل تلقائي، و يتطلب تحويلها يدويًا . الكود الثاني يقوم بذلك تلقائيًا باستخدام C(). في الكود الأول، يجب إضافت الحد الثابت يدويًا باستخدام sm.add_constant(X). في الكود الثاني، يتم تضمينه تلقائيًا. الكود الثاني أكثر كفاءة عندما تحتوي البيانات على متغيرات فئوية، لأنه يحولها تلقائيًا دون الحاجة إلى معالجة إضافية.
  2. هناك عدة أسباب من الممكن ان تجعل الكود يأخذ وقتًا طويلًا في التنفيذ على Kaggle Notebook مثل استخدام وحدة معالجة ضعيفة (CPU بدلا GPU/TPU) يمكنك تحديد وحدة المعالجة من خلال الانتقال الي (Settings)الاعدادات ثم اختيار Accelerator وحدد GPU أو TPU حسب الحاجة اليه . اذا كنت تستخدم TensorFlow يمكنك استخدام هذا الامر للتاكد من استخدامك لوحدة المعالجة import tensorflow as tf print(tf.config.list_physical_devices('GPU')) او هذا الامر اذا كنت تستخدم PyTorch import torch print(torch.cuda.is_available()) احد الاسباب الاخري التي قد تجعل الكود يأخذ وقتًا طويلًا في التنفيذ على Kaggle Notebook هي اذا كنت تقوم بتحميل مجموعة بيانات كبيرة مباشرة من الإنترنت أو من Kaggle Datasets . من الافضل ان تقوم بتحميل البيانات مرة واحدة ثم احفظها في الـ output directory لاستخدامها لاحقًا دون إعادة التحميل استخدم هذا الامر لتحميل البيانات اذا كانت البيانات من موقع خارجي من الانترنت import pandas as pd df = pd.read_csv("https://example.com/data.csv") df.to_csv("/kaggle/working/output/data.csv", index=False) اذا كنت تستخدم بيانات مأخوذة من Kaggle Datasets نفسه يمكنك استخدام هذا الامر لنسخها الي /kaggle/working/output/ حتى تصبح متاحة للاستخدام دون الحاجة لإعادة التحميل !cp -r /kaggle/input/dataset-folder-name /kaggle/working/output/
×
×
  • أضف...