اذهب إلى المحتوى

Chihab Hedidi

الأعضاء
  • المساهمات

    2957
  • تاريخ الانضمام

  • تاريخ آخر زيارة

  • عدد الأيام التي تصدر بها

    13

كل منشورات العضو Chihab Hedidi

  1. التوزيعات الاحتمالية تساعد في توصيف البيانات ومعرفة كيف تتوزع، و هذا لمعرفة هل البيانات تتبع توزيعا طبيعيا، أم توزيعا آخر مثل التوزيع الأسي أو التوزيع الثنائي، و هذا الفهم مهم لتحديد الأدوات والنماذج المناسبة لتحليل البيانات، و أيضا العديد من التحليلات الإحصائية تعتمد على افتراض أن البيانات تتبع توزيعا معينا، فمثلا اختبار T-test يفترض أن البيانات تتبع توزيعا طبيعيا، و الانحدار اللوجستي يعتمد على توزيع برنولي للبيانات الثنائية، و بالتالي معرفة التوزيع يجعل اختيار النموذج أكثر دقة. لذا فإن التوزيعات الاحتمالية أداة قوية لفهم البيانات وتفسيرها، واتخاذ قرارات مدعومة بالإحصاء، و بدون فهم التوزيع قد تكون التحليلات غير دقيقة أو مضللة.
  2. بالنسبة لهذا العمود فهو يمكن أن يكون مفيد حيث أنه بعض الأمراض تكون أكثر شيوعا أو أكثر خطرا في مجموعات عرقية معينة، و أيضا العرق يرتبط غالبا بتغيرات جينية يمكن أن تؤثر على الاستجابة للعلاجات أو الأدوية، فمثلا بعض الطفرات الجينية التي تؤثر على تحمل بعض الأدوية أو الاستجابة لها تكون أكثر شيوعا في مجموعات عرقية معينة، و بالتالي فهذ العوامل تؤثر على النتائج الصحية، مثل الاستعداد الوراثي للأمراض، أو الاستجابة للعلاج، أو حتى التفاوتات الاجتماعية والصحية التي قد تؤثر على جودة الرعاية المقدمة.
  3. ستحتاج إلى تغييرها من خلال الإعدادات في صفحة الحسابات الخاصة بحسوب، ثم إختر المعلومات الشخصية و بعدها يمكنك تحديد الصورة التي تريد و بعد فترة قصيرة سيتم تحديثها عندك في كل المنصات.
  4. إذا كان العمود مهما جدا حاول جمع البيانات المفقودة من مصدر آخر أو إعادة حسابها باستخدام مصادر خارجية، فهذا هو الحل المثالي، أو يمكنك استخدام المتوسط إذا كانت البيانات رقمية ومستقرة بهذا الشكل: df['column_name'].fillna(df['column_name'].mean(), inplace=True) إذا كنت تعمل على مشكلة تتعلق بالتنبؤ، يمكنك تجربة استبعاد الصفوف ذات القيم المفقودة ومقارنة الأداء، لكن هذا قد يؤدي إلى فقدان قدر كبير من البيانات أي 33% فقط متاحة.
  5. إذا كانت بياناتك منظمة وتحتوي على عدد أعمدة كبير ولكن بعدد عينات صغير إلى متوسط، فمن الأفضل البدء بخوارزميات التعلم الآلي التقليدية مثل XGBoost أو Random Forest، حيث إنها فعالة مع البيانات الجدولية وسريعة في التدريب والتفسير، أما إذا كانت بياناتك كبيرة جدا ومعقدة وتحتوي على أنماط غير خطية، ولديك موارد كافية أي GPU قوي، فإن التعلم العميق يكون خيار أفضل، يعني أولا جرب النماذج التقليدية أولا لأنها أسرع وأبسط، ثم انتقل إلى التعلم العميق إذا كانت النتائج غير مرضية.
  6. أنت إخترت مجالات كثيرة و هذا الأمر خاطئ، ركز على المجال الذي يثير اهتمامك أكثر، و اختر مجالا يتناسب مع مهاراتك الحالية أو رغبتك في التعلم، ثم قم بإنشاء سيرة ذاتية و اجعلها مختصرة وتبرز مهاراتك وأي مشاريع أو دراسات ذات صلة، و أيضا قم بإنشاء حساب على LinkedIn و اجعله محدثا ويعرض خبرتك وأهدافك. أما بالنسبة للبحث يمكنك إستخدام مواقع التوظيف المعروفة، أو مراسلة الشركات التي في منطقتك بإيمايل إحترافي و بالتأكيد سيتم الرد عليك و تجد وظيفة أو تدريب في أسرع وقت.
  7. بالنسبة للدورات الخاصة بالأكاديمية فكلها يتم تحديثها بشكل دوري بإضافة مسارات جديدة، أو تحديث المسارات القديمة، و بالتأكيد طلبك سيصل إلى الإدارة و يتم إتخاذه بعين الإعتبار. يمكنك الإطلاع دائما على آخر التحديثات من الصفحة الخاصة بهذا الأمر من خلال هذا الرابط: https://academy.hsoub.com/release-notes/
  8. يمكن استخدام Label Encoding مع أي عمود يحتوي على قيم فريدة، حيث في حالة العمود يحتوي على متغيرات ثنائية فإن Label Encoding يعتبر مناسبا جدا حيث سيتم تحويل القيم إلى 0 و1، مما يسهل معالجتها في النماذج، و في حالة العمود يحتوي على متغيرات متعددة الفئات يمكنك استخدام Label Encoding لتحويل القيم النصية إلى أرقام. أما في حالة وجود عدد كبير جدا من الفئات، قد يؤدي ذلك إلى مشاكل مثل زيادة تعقيد النموذج وصعوبة في التفسير، و في هذه الحالة من الأفضل استخدام One-Hot Encoding، حيث يتم تحويل كل فئة إلى عمود جديد يحتوي على 0 أو 1.
  9. بالنسبة للإختبار للتقدم إليه يجب إنهاء 4 مسارات على الأقل، و بعدها يمكنك التقدم، أما بالنسبة للأسئلة و الإختبار فسيكون حول تلك المسارات فقط و بالتالي إذا لم تدرسي مسار سكراتش فلن يتم وضع أسئلة حوله.
  10. وعليكم السلام ورحمة الله وبركاته، صحيح أن لغة UML مرتبطة أكثر بمفهوم البرمجة الكائنية التوجه، ولكن يمكن استخدامها أيضا في مشاريع تعتمد على Node.js حتى وإن كانت Node.js مبنية على JavaScript، وهي لغة تدعم البرمجة الوظيفية بالإضافة إلى البرمجة الكائنية، حيث يمكنك إستخدام Deployment Diagram لتوضيح خوادم Node.js، قواعد البيانات، وأي خدمات خارجية، و أيضا Component Diagram لتحديد مكونات المشروع مثل وحدات الـ APIs، أو الوحدات المستقلة داخل المشروع. فهذه الأنواع من الرسوم البيانية مفيدة بغض النظر عن نوع البرمجة المستخدم، ف UML يمكن استخدامها لتصميم التدفقات والمنطق المعماري حتى مع الأنظمة المبنية على Node.js، ولكن التركيز يكون على تصميم النظام والتدفق العام وليس فقط الكائنات.
  11. طريقة الكتابة هذه هي شائعة في لغة بايثون، لكنها لا تؤثر على كفاءة الكود أو أدائه، و الهدف الأساسي من كتابة هذا الشكل هو تسهيل استخدام المكتبة بطريقة مختصرة وسهلة القراءة، بدلا من كتابة اسم المكتبة الكامل في كل مرة يمكنك استخدام الاسم المختصر بهذا الشكل: np.array([1, 2, 3]) يعني هو مجرد تحسين لجمالية الكود وقابليته للقراءة، ولا يساهم في تحسين الكفاءة أو الأداء.
  12. الخطأ الذي يظهر لديك يعني أن الكائن x_train_scaled هو مصفوفة، وليس كائن DataFrame من مكتبة Pandas، و المصفوفات في Numpy لا تحتوي على أسماء أعمدة، ولذلك لا يمكنك استخدام columns. إذا كنت قد قمت بتقييس البيانات باستخدام مكتبة مثل StandardScaler من sklearn، فمن الطبيعي أن تكون النتيجة عبارة عن مصفوفة Numpy، و لجعل الأمور أسهل، يمكنك تحويل المصفوفة مرة أخرى إلى DataFrame باستخدام الأعمدة الأصلية: import pandas as pd x_train_scaled_df = pd.DataFrame(x_train_scaled, columns=x_train.columns) print(x_train_scaled_df.columns)
  13. أسباب المشكلة كثيرة، قد يكون HOMA_IR نظريا متغير مهم، ولكن العلاقة بينه وبين Outcome قد تكون غير خطية أو ضعيفة نسبيا، ونموذج SGDRegressor يعتمد على العلاقات الخطية، وبالتالي قد يفشل في التعرف على العلاقات غير الخطية، جرب نماذج تدعم العلاقات غير الخطية مثل Random Forest Regressor، أو Gradient Boosting Models مثل XGBoost.
  14. ليس من الضروري تثبيت لغة ++C نفسها لتشغيل بايثون أو مكتباتها، ولكن هناك بعض المكتبات تعتمد على مكتبات مكتوبة بلغة ++C أو لغات أخرى لتحسين الأداء، و أثناء تثبيت هذه المكتبات، يتم أحيانا استخدام أدوات بناء مثل CMake أو GCC لترجمة الأكواد المصدرية الخاصة بها، و لحل هذه المشكلة يجب عليك تثبيت Visual Studio Build Tools فقط.
  15. الكود الذي أرفقته لا يؤثر على العمود HOMA_IR و بالتالي ربما في جزء أخر من الكود هو المسؤول عن حذف العمود، أي ربما تم حذفه أثناء عملية المعالجة المسبقة للبيانات Preprocessing عن طريق الخطأ، لذا تحقق من وجود HOMA_IR في بيانات x_train_scaled و x_test_scaled بعد معالجة البيانات عن طريق هذا الكود: print(x_train_scaled.columns) إذا لم يكن العمود موجود، فستحتاج إلى إضافته مرة أخرى قبل التدريب.
  16. بالتأكيد وجود خلفية سابقة في لغات HTML و CSS يلعب دورا كبيرا في شعورك بأن المحاضر يمر على المواضيع بسرعة،عندما تكون لديك معرفة مسبقة يصبح استيعاب المحتوى أسرع، وقد تشعر أن الشرح مختصر، أما بالنسبة لقصر مدة الفيديوهات فهذا لأنه يتم الإعتماد على تقديم أهم النقاط دون إطالة غير ضرورية، وللحفاظ على تركيز المتعلم وتجنب الشعور بالملل، و إذا كان لديك أي جزء من الفيديو غير مفهوم يمكنك دائما طرح تساؤلك أسفل الفيديو.
  17. نعم يمكنك شراء اسم دومين واستخدامه هذه المنصات تدعم استخدام الدومينات المخصصة بسهولة، Namecheap، Google Domains ،GoDaddy و غيرها و تحقق من توفره أولا ثم من خلال لوحة التحكم يمكنك إعدادات الدومين مع Cloudflare Pages.
  18. إذا كنت ترى أن هذه المقدمة تغطي مفاهيم أنت بالفعل ملم بها ولديك فهم جيد لها، فمن الممكن تجاوزها والتركيز على المسارات الأخرى، و لكن أنصحك بمراجعة سريعة لمحتواها حتى و لو بدون تطبيق للتأكد من أنك لم تفوت أي مفاهيم أساسية قد تكون مهمة لاحقا، فالبرمجة تعتمد بشكل كبير على الأساسيات، وأي فجوة فيها قد تؤثر على فهمك للمواضيع الأكثر تعقيدا.
  19. بما أن النموذج المستخدم في الكود هو RandomForestRegressor، فإن التقييم لا يعتمد عادة على النسبة المئوية للدقة كما هو الحال في التصنيف، بل يعتمد على أخطاء القياس مثل Mean Squared Error وهو يقيس متوسط مربع الأخطاء بين القيم الحقيقية والقيم المتوقعة. أو يمكنك إستخدام R² Score وهو مقياس شائع يعطي فكرة عن مدى جودة النموذج في تفسير البيانات، حيث أن قيمة 1.0 تعني أن النموذج يفسر البيانات بشكل كامل و بالتالي 0.90 تعني أن النموذج يفسر 90% من التباين في البيانات.
  20. نعم يمكنك استخدام مكتبات التعلم الآلي مثل Scikit-learn لتنفيذ هذه الأمور، فهذه المكتبة تحتوي على العديد من الدوال التي تساعدك في هذا الأمر.
  21. نعم يمكنك ذلك عن طريق اختيار الميزات أو Feature Selection، حيث يمكنك إعطاء الأولوية لميزات معينة أثناء التدريب مع عدم تجاهل باقي الميزات، و يمكنك إختيار المميزات إما يدويا أو يمكنك استخدام مقاييس الميزات المهمة التي يتم إنتاجها تلقائيا، مثل Gini Importance أو Permutation Importance، لتوجيه النموذج للتركيز على الميزات المهمة. كما يمكنك تدريب النموذج على مرحلتين، في المرحلة الأولى يتم تدريب النموذج على جميع الميزات لمعرفة التأثير العام، و في المرحلة الثانية قم بإعادة تدريب النموذج مع إعطاء الأولوية للميزات الثلاثة المهمة، إما عن طريق إدخالها بشكل متكرر أو تقليل تأثير الميزات الأخرى.
  22. يمكنك إعادة مشاهدة الفيديوهات مع تسريع الفيديو و هذا لتذكر محتواه فقط، و أيضا من الأفضل إذا كان لديك أي ملخصات أو دروس كنت قد كتبتها من قبل يمكنك إعادة مراجعتها فهذا سيسهل الأمر عليك، أما في حالة كنت لا تتذكر الدروس بشكل جيد فمن الأفضل إعادتها كلها بالسرعة العادية، وبالتأكيد مع التطبيق المباشر ستتذكر بشكل أسرع.
  23. هذا الأمر يعتمد على عدد ساعات العمل اليومية والأسبوعية التي يعمل بها مدير المشروع عادة، إذا إفترضنا أنه يعمل 40 ساعة في الأسبوع، و ثلاثة أشهر هي حوالي 12 أسبوعا و بالتالي: 12 x 40 = 480 أي سيحتاج مدير المشروع إلى حوالي 480 ساعة لإتمام المهام الضرورية على افتراض أنه يعمل بدوام كامل على هذا المشروع. أما إذا كان يعمل لعدد محدود من الساعات فقط على هذا المشروع، يمكن تقدير الوقت بتعديل عدد الساعات الأسبوعية بناء على هذا الافتراض.
  24. بالنسبة ل Jupyter فهو من أكثر الأدوات شيوعا في مجال تحليل البيانات، ويرجع ذلك لسهولة استخدامه وواجهته التفاعلية التي تتيح للمستخدم كتابة الأكواد وتشغيلها بشكل متتابع، مما يمكنه من متابعة النتائج لحظيا وإجراء التعديلات بسرعة، كما يمكنك إدراج النصوص التوضيحية بين الخلايا البرمجية، مما يسهم في توثيق خطوات التحليل بشكل مرتب ومنظم. و يدعم حتى مكتبات التصور البياني مثل Matplotlib وSeaborn، مما يسهل عرض الرسوم البيانية وتحليل البيانات بصريا. أما R Markdown، فهو أداة شبيهة بـ Jupyter إلى حد كبير، لكنه يستخدم غالبا مع لغة R ويهدف إلى إنشاء تقارير منظمة يمكن تصديرها بصيغ متعددة مثل HTML أو PDF أو Word، و يتم إستخدامه أيضا على نطاق واسع في الأبحاث العلمية والأكاديمية لتحليل البيانات بلغة R وتقديم النتائج بشكل منسق.
  25. كل المعاملات الخاصة بالدورات من إختصاص مركز المساعدة، يمكنك التواصل معه و شرح طلبك في رسالة واحدة و بالتأكيد سيقومون بمساعدتك بخصوص هذا الأمر، و بالمناسبة تستطيع مشاهدة المسار الأول من كل دورة و من خلاله يمكنك إختيار الدورة الصحيحة التي تناسبك. بالتوفيق في مسارك التعليمي.
×
×
  • أضف...