اويس عبد الباسط ذياب بني ملحم نشر 10 مايو أرسل تقرير نشر 10 مايو https://colab.research.google.com/drive/1XIs_USwuFzfDGViEiq1IfoJ0YI8vmYld?usp=sharing&authuser=0#scrollTo=987jhOCizSVU 2 اقتباس
0 Mustafa Suleiman نشر 10 مايو أرسل تقرير نشر 10 مايو لا يتم توفير إجابة مباشرة لمثل تلك الأسئلة، وذلك لكي تحقق استفادة أنت، المطلوب منك هو التالي: تحميل مجموعة البيانات وقدم نظرة عامة أساسية من خلال df.info()، df.columns، df.describe()، والميثودز الأخرى. افهم هيكلية البيانات، بما في ذلك أسماء الأعمدة، أنواع البيانات، والإحصائيات الأساسية. بالنسبة للأعمدة الرقمية، قم بتحليل توزيعها كالهيستوغرام والانحراف، وحدد المشكلات التالية: التوزيعات ذات الانحراف العالي، سواء إيجابي أو سلبي. القيم المتطرفة التي تبتعد بشكل كبير عن الباقين. أي مشكلات منهجية في البيانات كقيم غير منطقية مثل الأجور السلبية. اقترح حلولاً لمعالجة تلك المشكلات لكل عمود رقمي وقم بتطبيقها. 3- هندسة الميزات أو Feature Engineering قم بإجراء اختيار الميزات للاحتفاظ بالميزات الأكثر أهمية وإزالة تلك غير المهمة أو ذات الأهمية المنخفضة. واستخدم تقنيات مثل SelectKBest مع mutual_info_regression لاختيار أفضل الميز Comfy إن كانت الميزة ذات أهمية منخفضة، قم بإسقاطها. 4- استخلاص الميزات Feature Extraction عليك إنشاء ميزات جديدة من الأعمدة الموجودة لتحسين مجموعة البيانات. باستخلاص السنة، الشهر، اليوم، والساعة من أعمدة التاريخ والوقت، وحساب مسافة الرحلة باستخدام صيغة Haversine بناءًا على إحداثيات الالتقاط والتوصيل. ستحتاج إلى قراءة الدروس التالية: اقتباس
0 محمد_عاطف نشر 10 مايو أرسل تقرير نشر 10 مايو هنا في موقع الأكاديمية لا نقوم بتوفير الإجابات لأسئلة الإختبارات و التقيمات ولكن يمكننا إرشادك لطريقة الحل . مطلوب منك في المهمة الأولى بالنسبة للأعمدة الرقمية أن تتحقق من التوزيع وتوضيح ما الذي وجدته وأيضا ما هي المشكلات الموجودة في تلك الاعمدة والبيانات . وأيضا يمكنك افتراض واقتراح وتطبيق حلول لكل مشكلة في كل عمود. وأيضا يخبرك من التوزيع يجب تحديد المشكلات في هذه التوزيعات بما في ذلك: الانحراف (Skewness): عدم تماثل التوزيع التحيز (Bias): تفضيل نظامي لقيم معينة القيم المتطرفة (Outliers): قيم تختلف بشكل كبير عن باقي البيانات وفي المطلوب الثاني يتم طلب تطبيق تقنيات هندسة الميزات و اختيار الميزات لتحسين نموذج التعلم الآلي الخاص بك.حيث يجب عليك : اختيار أو إنشاء ميزات لها علاقة حقيقية بالمشكلة التي تحاول حلها الاحتفاظ بالميزات المهمة فقط وحذف غير المهمة وفي المطلوب الأخير يرجى توضيح كيفية إنشاء ميزات جديدة (New Features) من الأعمدة الموجودة في مجموعة البيانات الخاصة بك، دون تقديم الحل النهائي . وإليك المقالات التالية التي من الممكن أن تساعدك في الحل : اقتباس
السؤال
اويس عبد الباسط ذياب بني ملحم
https://colab.research.google.com/drive/1XIs_USwuFzfDGViEiq1IfoJ0YI8vmYld?usp=sharing&authuser=0#scrollTo=987jhOCizSVU
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.