اذهب إلى المحتوى

عبد الوهاب بومعراف

الأعضاء
  • المساهمات

    927
  • تاريخ الانضمام

  • تاريخ آخر زيارة

6 متابعين

المعلومات الشخصية

آخر الزوار

499 زيارة للملف الشخصي

إنجازات عبد الوهاب بومعراف

عضو نشيط

عضو نشيط (3/3)

440

السمعة بالموقع

7

إجابات الأسئلة

  1. أودّ إخبارك بأنّ هذا الإجراء طبيعي للغاية وهو من باب حرص المنصة على زيادة الموثوقية بينك المستقلّين والعملاء، وفي هاته الحالة لقد أرشدوك إلى خيارين إمّا من خلال رفع الملفات المصدرية لأعمالك وهي تلك الملفات التي قمت بالعمل عليها حين إنجازك للمشاريع فمثلا لو كنت مصمما غرافيكيا فيجب إرفاق الملفات كالتالي: ملفات Adobe Illustrator (.ai): إذا كنت تستخدم Illustrator . ملفات Adobe Photoshop (.psd): إذا كنت تستخدم Photoshop. والخيار الثاني من خلال قيامك بأخذ لقطات شاشة تبين فيها المشروع وأنت تعمل على تطويره على جهازك ببساطة يمكنك فتح كل مشروع منفردا على جهازك ثم أخذ لقطة شاشة له ثم رفعها على معرض أعمالك أرجو الاطلاع على شروط الانضمام لمستقل من هنا: الانضمام كمستقل ويمكنك إيجاد أجوبة مختلفة للأسئلة الشائعة بخصوص مستقل من هنا: الأسئلة الشائعة
  2. عندما تكون القيم في عمود معين عبارة عن 0 أو 1 عادة ما يكون هذا عمودا ثنائيا يمثل حالة معينة، مثل نعم و لا، في هذه الحالة القيم المتطرفة يمكن أن تكون أي قيمة أخرى من دون هذه القيم مثل 2 أو -1، فهذه قيم شاذة يجب التحقق منها وتنظيفها، و بالتالي يجب عليك معرفة القيم التي يحتويها هذا العمود كاملة حتى تستطيع تنظيفه.
  3. للأسف الدورة ليست مجانية لكن الاستثمار فيها يستحقّ ذلك، لكن المميز فيها هو أنّه يمكن لأحد أقاربك أو معارفك إهداؤك بطاقة هدية من خلال شرائها ثم إرسالها إليك، يمكنك الاطلاع على ذلك من هنا: شراء وإهداء بطاقة الهدية. كما قلت لك فالاستثمار في الدورة جيد للمزايا الخاصة بها: مزايا دورات الأكاديمية. يمكنك الانتظار إلى حين إطلاق أيّ عروض أو تخفيضات وإتاحتها من قبل الإدارة، أرجو التواصل معهم لأيّ استفسار متعلق بالدورات: مركز دعم مساعدة أكاديمية حسوب.
  4. التشتت ونسيان بعض الأمور عند الانتقال من مسار إلى آخر هو أمر عادي وقد يحصل لأيّ شخص، لهذا فالمراجعة هي السر في المحافظة على المعلومات كما أنّ التطبيق العملي والاستمرارية هي التي ترسخ تلك المفاهيم في أذهاننا، أرجو مراجعة الأجوبة على سؤال مماثل من هنا:
  5. وعليكم السلام ورحمة الله، هي شريحة ويلو الكمومية وقد أطلقتها شركة غوغل الأسبوع الفارط، وهي تحتوي على 105 كيوبت وكما نعلم فالكيوبت هو أساس الحواسيب الكمومية، والحوسبة الكمومية تعد اليوم مجالا ثوريا يستحق الاهتمام نظرا لقدرتها على حل مشكلات معقدة لا تستطيع الحواسيب التقليدية التعامل معها كما أنّ اعتمادها على الكيوبتات التي تمكنها من إجراء عمليات حسابية متوازية بسرعة هائلة زاد من دور الشركات الكبرى في البحث العلمي والتطوير ومن أبرز تطبيقاتها تسريع اكتشاف الأدوية من خلال محاكاة الجزيئات، وتحسين أداء الذكاء الاصطناعي، وتطوير بطاريات أكثر كفاءة عبر محاكاة المواد كما أنّها تساهم في تحسين التشفير والأمن السيبراني بطرق لم تكن ممكنة من قبل، مما يجعلها حجر الأساس للمستقبل التقني والعلمي.
  6. بالنظر إلى القيم التي ذكرتها في العمودين tce_div_match و tce_match، يمكن ملاحظة التشابه في الفئات الموجودة بين العمودين مع بعض الاختلاف في عدد القيم لكل فئة، ولكن الأرقام في الفئات المتطابقة ليست متماثلة و هذا يشير إلى أن تعريف التصنيفات قد يكون مختلفا قليلا بين العمودين، أو أن هناك تباينا في طريقة جمع البيانات. و أيضا ذكرت أن 60% من البيانات مفقودة في tce_match، مما يعني أن هذا العمود ليس مكتملا بدرجة كافية لاستخدامه بمفرده أو الاعتماد عليه في التحليل، لذا إذا كانت البيانات في العمود tce_div_match مكتملة وتعطي التصنيفات المطلوبة لتحليلك، فمن الممكن الاعتماد عليه بدلا من tce_match، خاصة أن الأخير يحتوي على نسبة كبيرة من القيم المفقودة.
  7. الدالة dropna في مكتبة pandas تستخدم بشكل أساسي لمسح الصفوف التي تحتوي على قيم مفقودة (NaN) لذلك إذا كنت ترغب في مسح عمود بالكامل، يمكنك استخدام drop مع تحديد اسم العمود كالآتي: df = df.drop(columns=['اسم العمود']) أما لمسح الصفوف نستخدم: df = df.dropna()
  8. التعامل مع القيم المفقودة هو تحد شائع في مختلف مجالات البيانات وليس البيانات الطبية فقط فحتى المالية، الاجتماعية، والبيئية بل تشمل جميع أنواع البيانات التي تتأثر بفقدان المعلومات يمكنك مراجعة الإجابتين على هذا السؤال الذي يتعلق حول كيفية التعامل مع القيم المفقودة: أما بشأن استخدام بيانات مريض آخر لملء عمود مفقود يمكن أن يكون حلا مناسبا في بعض الحالات، بشرط أن تكون البيانات متشابهة من حيث الشروط السريرية والتجريبية لذا يجب أن تكون حذرا لأن هذا قد يؤدي إلى إدخال تحيزات أو أخطاء إذا كانت البيانات تختلف بشكل كبير لذا من المهم تقييم مدى تماثل البيانات والتأكد من عدم التأثير السلبي على جودة التحليل.
  9. يمكنك مراجعة هذه المقالة ستطلعك على خطوات التحميل والتثبيت ومعلومات مهمة أخرى: قد تجد العديد من المصادر التعليمية لكنها تبقى عبارة عن اجتهادات وأفضل مصدر موثوق هو التوثيق الرسمي الخاص بها لذا أنصحك بالتعلم بالتوازي معها: التوثيقات.
  10. وعليكم السلام ورحمة الله تعالى وبركاته، حاليا لا يوجد مجتمع خاص داخل الأكاديمية، لكن بشكل غير مباشر يمكنك طرح أسئلتك واستفساراتك في قسم الأسئلة العامة وستجد العديد من الطلبة والمهتمين وحتى من المدربين من سيتفاعل معك ويناقش أفكارك ويساعدك على حلّ مشاكلك إن وجدت، لقد طُرح هذا السؤال من قبل هنا:
  11. الشرط يضمن أنك تطبق LabelEncoder فقط على الأعمدة النصية (object) دون التأثير على الأعمدة الرقمية. بدون الشرط، قد يتم تعديل الأعمدة الرقمية بشكل غير مقصود، مما يفسد البيانات.
  12. الفرق الرئيسي بين object و str يكمن في أن object هو نوع بيانات عام في Pandas يستخدم لتخزين النصوص أو بيانات مختلطة (مثل أرقام ونصوص معا)، بينما str هو نوع بيانات مخصص للنصوص في Python أي عند قراءة بيانات باستخدام Pandas، يتم تخزين الأعمدة النصية ك object افتراضيا لذلك نجد الشرط التالي if data_train[columns].dtypes == object يعمل لأنه يتحقق من نوع العمود في Pandas، بينما if data_train[columns].dtypes == str لا يعمل لأن النصوص ليست من نوع str في Pandas بشكل افتراضي.
  13. وعليكم السلام ورحمة الله وبركاته، كلاهما يتم استخدامهما في معالجة البيانات وخصوصا عند التعامل مع المتغيرات الفئوية في تعلم الآلة أبرز الفروق بينهما هي كالآتي: أولا، LabelEncoder يستخدم لتحويل القيم النصية أو الفئوية (categorical) إلى قيم عددية (numeric) بحيث يتم إعطاء كل فئة رقما صحيحا ويتم استخدامه عندما تكون الفئات مرتبة أو عند الحاجة لتصنيف واحد فقط لكل فئة مثلا إذا كانت لديك قائمة بالفئات التالية: ['Red', 'Green', 'Blue'] فسيقوم بتحويلها إلى التالي: [0, 1, 2] أما OneHotEncoder فيحول كل فئة إلى مجموعة من الأرقام الثنائية (binary) بحيث يكون لكل فئة عمود منفصل، ويتم وضع 1 في العمود الذي يمثل الفئة والباقي 0 ونستخدمه عندما نحتاج إلى تمثيل غير مرتب للفئات مثلا إذا كان لدينا نفس القائمة السابقة فسيتم تحويلها إلى: Red Green Blue 1 0 0 0 1 0 0 0 1 لو تركز قليلا ستجد أنّ LabelEncoder يعطي تمثيلا عدديا بسيطا، بينما OneHotEncoder يفصل كل فئة في عمود مستقل، وهو أكثر شمولا للفئات غير المرتبة.
  14. أهمية مجال الثقة في تحليل البيانات تكمن في قدرته على قياس مدى دقة وموثوقية التقديرات المستخلصة من العينة، حيث يحدد نطاقا يحتمل أن يحتوي على القيمة الحقيقية لمعلمة المجتمع الإحصائي بمستوى ثقة معين يساهم ذلك في إظهار درجة عدم اليقين في النتائج، دعم اختبار الفرضيات، وتوفير أساس لاتخاذ قرارات مدروسة، مما يجعل التحليل أكثر شمولية ودقة بدلا من الاعتماد على تقديرات نقطية قد تكون مضللة. أي أنّ مجال الثقة يضيف مصداقية لتحليل البيانات لأنه يظهر مدى دقة وموثوقية النتائج، ويقلل من الاعتماد على القيم المفردة التي قد تكون مضللة، مما يجعله أداة أساسية لتحليل البيانات الإحصائية يمكنك مطالعة المزيد حوله من هنا:
  15. إذا كنت تقصد أن type الخاص بعمود في DataFrame هو "Other"، فهذا يعني أن نوع العمود ربما يحتوي على قيم مختلطة، مثل وجود أرقام ونصوص معا، أو أيضا إذا كان هناك قيم مفقودة بجانب قيم أخرى. لذا قم بفحص القيم الموجودة في العمود، و إذا كنت تعرف نوع البيانات المتوقع، يمكنك تحويل العمود: print(df['column_name'].unique()) لتحويل إلى نصوص: df['column_name'] = df['column_name'].astype(str) لتحويل إلى أرقام: df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce') بالنسبة ل errors='coerce' يحول القيم غير القابلة للتحويل إلى NaN.
×
×
  • أضف...