اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

الدالة KNNImputer تستخدم لملء القيم المفقودة في مجموعة البيانات والغرض منها هو تعويض القيم المفقودة في البيانات بحيث يتم استخدام خوارزمية الجار الأقرب k-nearest neighbors وللتبسيط فهي تبحث عن k وهي نقاط البيانات الأقرب للقيمة المفقودة وتستخدم متوسطها أو وسيطها لملء الفراغ وما يميزها أنها تحافظ على العلاقات بين المتغيرات وتعمل بشكل جيد مع البيانات غير الخطية.

  • 0
نشر

ذلك كلاس في وحدة impute في مكتبة scikit-learn تُطبق خوارزمية الإكمال بمساعدة خورازمية أقرب جيران KNN.

والإكمال imputation هو عملية استبدال القيم المفقودة في مجموعة البيانات بقيم معقولة، فذلك ضروري لأن العديد من خوارزميات التعلم الآلي لا يمكنها التعامل مع القيم المفقودة، ويساعد الأمر في ضمان اكتمال مجموعة البيانات واتساقها.

في حين إكمال KNN هو نوع من الإكمال يستخدم خوارزمية أقرب جيران KNN لملء القيم المفقودة، أي الفكرة هي العثور على أقرب K مثيل (أقرب جيران) للمثيل الذي يحتوي على قيم مفقودة، ثم استخدام قيمها لإكمال القيم المفقودة.

وآلية عمل KNNImputer بشكل مختصر كالتالي:

  1. يحدد المُكمّل المثيلات التي تحتوي على قيم مفقودة في مجموعة البيانات.
  2. لكل مثيل يحتوي على قيم مفقودة، يعثر المُكمّل على أقرب K مثيل (أقرب جيران) حسب مقياس المسافة (مثلاً مسافة إقليدية).
  3. يستخدم المُكمّل قيم أقرب K جيران لإكمال القيم المفقودة. يمكن القيام بذلك باستخدام استراتيجيات مختلفة:
  • مثل: إكمال المتوسط Mean imputation: يستبدل القيمة المفقودة بمتوسط القيم المقابلة من أقرب K جيران.
  • إكمال الوسيط Median imputation: تبديل القيمة المفقودة بوسيط القيم المقابلة من أقرب K جيران.
  • إكمال المتوسط المرجح Weighted average imputation: يستبدل القيمة المفقودة بمتوسط مرجح للقيم المقابلة من أقرب K جيران، حيث تعتمد الأوزان على المسافة بين المثيلات.

ويحتوي كلاس KNNImputer على العديد من المعلمات التي يمكن ضبطها:

  1. n_neighbors: عدد أقرب جيران للنظر فيها (القيمة الافتراضية هي 2).
  2. weights: مخطط الترجيح المستخدم للإكمال (القيمة الافتراضية هي uniform، مما يعني أن جميع الجيران لها وزن متساوٍا).
  3. metric: مقياس المسافة المستخدم للعثور على أقرب جيران (القيمة الافتراضية هي euclidean). missing_values: القيمة التي تمثل القيم المفقودة (القيمة الافتراضية هي np.nan).
  • 0
نشر
بتاريخ On 8‏/9‏/2024 at 12:06 قال Mustafa Suleiman:

ذلك كلاس في وحدة impute في مكتبة scikit-learn تُطبق خوارزمية الإكمال بمساعدة خورازمية أقرب جيران KNN.

والإكمال imputation هو عملية استبدال القيم المفقودة في مجموعة البيانات بقيم معقولة، فذلك ضروري لأن العديد من خوارزميات التعلم الآلي لا يمكنها التعامل مع القيم المفقودة، ويساعد الأمر في ضمان اكتمال مجموعة البيانات واتساقها.

في حين إكمال KNN هو نوع من الإكمال يستخدم خوارزمية أقرب جيران KNN لملء القيم المفقودة، أي الفكرة هي العثور على أقرب K مثيل (أقرب جيران) للمثيل الذي يحتوي على قيم مفقودة، ثم استخدام قيمها لإكمال القيم المفقودة.

وآلية عمل KNNImputer بشكل مختصر كالتالي:

  1. يحدد المُكمّل المثيلات التي تحتوي على قيم مفقودة في مجموعة البيانات.
  2. لكل مثيل يحتوي على قيم مفقودة، يعثر المُكمّل على أقرب K مثيل (أقرب جيران) حسب مقياس المسافة (مثلاً مسافة إقليدية).
  3. يستخدم المُكمّل قيم أقرب K جيران لإكمال القيم المفقودة. يمكن القيام بذلك باستخدام استراتيجيات مختلفة:
  • مثل: إكمال المتوسط Mean imputation: يستبدل القيمة المفقودة بمتوسط القيم المقابلة من أقرب K جيران.
  • إكمال الوسيط Median imputation: تبديل القيمة المفقودة بوسيط القيم المقابلة من أقرب K جيران.
  • إكمال المتوسط المرجح Weighted average imputation: يستبدل القيمة المفقودة بمتوسط مرجح للقيم المقابلة من أقرب K جيران، حيث تعتمد الأوزان على المسافة بين المثيلات.

ويحتوي كلاس KNNImputer على العديد من المعلمات التي يمكن ضبطها:

  1. n_neighbors: عدد أقرب جيران للنظر فيها (القيمة الافتراضية هي 2).
  2. weights: مخطط الترجيح المستخدم للإكمال (القيمة الافتراضية هي uniform، مما يعني أن جميع الجيران لها وزن متساوٍا).
  3. metric: مقياس المسافة المستخدم للعثور على أقرب جيران (القيمة الافتراضية هي euclidean). missing_values: القيمة التي تمثل القيم المفقودة (القيمة الافتراضية هي np.nan).

طيب انا بعد كا اعمل كده المفروض احفظ الملف عشان ؟

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...