اذهب إلى المحتوى
  • 0

استخدام الصف SelectPercentile لتطبيق مفهوم ال Feature Selection

Meezo ML

السؤال

Recommended Posts

  • 1

يقوم هذا الصف باختيار أهم ال Features في بياناتك التي تؤثر بقيم ال target اعتماداً على خوارزميتين f_classif أو chi2.
يتم استدعاؤه كالتالي:

sklearn.feature_selection.SelectPercentile

ويجب أن نقوم أيضاً باستدعاء خوارزميتي f_classif أو chi2:

sklearn.feature_selection.chi2 , f_classif

الصيغة:

SelectPercentile(score_func = f_classif , percentile=persentage)

score_func: تمثل الخوارزمية التي نريد تطبيقها f_classif أو chi2.
percentile: تمثل النسبة المئوية التي نريد اختيارها من الداتا، ويأخذ قيم بين ال 0 و ال 100  فمثلاً لو وضعنا 50 فهذا يعني أنه سيتم اختزال حجم الفيتشرز إلى النصف بحيث تكون ال 50% التي سيتم الاحتفاظ بها أهم الفيتشرز والباقي تستبعد لأنها أقل أهمية (أقل تأثيراً على قيم ال target) من وجهة نظر الخوارزمية.
ولعرض النتيجة التي حققتها كل feature نستخدم الواصفة scores_.
ونستخدم التابع get_support لعرض الفيتشرز التي تم الاحتفاظ بها والتي تم استبعاها.
مثال:

from sklearn.datasets import load_breast_cancer
from sklearn.feature_selection import SelectPercentile
from sklearn.feature_selection import chi2 , f_classif 
data, target = load_breast_cancer(return_X_y=True)
data.shape
#(569, 30)
fs = SelectPercentile(chi2, percentile=50)
data = fs.fit_transform(data,target)
data.shape
#(569, 15)
#لكل ميزة score عرض ال 
#fs.scores_

 

رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...