اذهب إلى المحتوى

السؤال

Recommended Posts

  • 1
نشر

يقوم هذا الصف باختيار أهم ال Features في بياناتك التي تؤثر بقيم ال target اعتماداً على خوارزميتين f_classif أو chi2.
يتم استدعاؤه كالتالي:

sklearn.feature_selection.SelectPercentile

ويجب أن نقوم أيضاً باستدعاء خوارزميتي f_classif أو chi2:

sklearn.feature_selection.chi2 , f_classif

الصيغة:

SelectPercentile(score_func = f_classif , percentile=persentage)

score_func: تمثل الخوارزمية التي نريد تطبيقها f_classif أو chi2.
percentile: تمثل النسبة المئوية التي نريد اختيارها من الداتا، ويأخذ قيم بين ال 0 و ال 100  فمثلاً لو وضعنا 50 فهذا يعني أنه سيتم اختزال حجم الفيتشرز إلى النصف بحيث تكون ال 50% التي سيتم الاحتفاظ بها أهم الفيتشرز والباقي تستبعد لأنها أقل أهمية (أقل تأثيراً على قيم ال target) من وجهة نظر الخوارزمية.
ولعرض النتيجة التي حققتها كل feature نستخدم الواصفة scores_.
ونستخدم التابع get_support لعرض الفيتشرز التي تم الاحتفاظ بها والتي تم استبعاها.
مثال:

from sklearn.datasets import load_breast_cancer
from sklearn.feature_selection import SelectPercentile
from sklearn.feature_selection import chi2 , f_classif 
data, target = load_breast_cancer(return_X_y=True)
data.shape
#(569, 30)
fs = SelectPercentile(chi2, percentile=50)
data = fs.fit_transform(data,target)
data.shape
#(569, 15)
#لكل ميزة score عرض ال 
#fs.scores_

 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...