باستخدم الكود ده
correlations = diabetes.corr()['Outcome'].sort_values(ascending=False)
top_features = correlations[1:]
plt.figure(figsize=(12,8))
top_features.plot(kind='bar' , color='skyblue' , edgecolor='black')
plt.title("Top Features Correlated With Outcome" , fontsize=14)
plt.xlabel('Features' , fontsize=14)
plt.ylabel("Correlation with Outcome" , fontsize=14)
plt.xticks(rotation=45 , fontsize=12)
plt.grid(axis='y' , linestyle='--' , alpha=0.7)
plt.tight_layout()
plt.show()
plt.savefig("Top-Features-Correlated-With-Outcome.png" , bbox_inches='tight')
ظهر ان االرسم ده
بس وانا بتدرب النموذج ظهارت حاجه غريب هو ان في ترتيب الميزات اختلف فا اي يعني الكلام ده ؟
وده الكود
modle_diabetes_randomforestregressor = RandomForestRegressor(n_estimators=10000 , max_depth=4 , random_state=33)
train = modle_diabetes_randomforestregressor.fit(x_train_scaled , y_train)
y_predict = train.predict(x_test_scaled)
importances = permutation_importance(modle_diabetes_randomforestregressor , x_test_scaled , y_test , n_repeats=10 , random_state=42)
importance_scores = importances.importances_mean
print(importance_scores)
sorted_features = np.argsort(importance_scores)[::-1]
print(sorted_features)
ودي رسمت الكود ده
plt.figure(figsize=(12,8))
plt.bar(range(len(sorted_features)) , sorted_features)
plt.xticks(range(len(sorted_features)), diabetes.columns[sorted_features], rotation=45)
plt.title("Feature Importance Using Permutation Importance" , fontsize=14)
plt.xlabel('Features' , fontsize=14)
plt.ylabel("Importance Scores" , fontsize=14)
plt.grid(axis='y' , linestyle='--' , alpha=0.7)
plt.tight_layout()
#plt.show()
plt.savefig("Importance-Scores.png" , bbox_inches='tight')
ودي الرسم
فا انا عاوز اعرف ازي اقبل ما اتدريب النموذج يكون الترتيب الGlucose وبعد كده الHOMA_IR وب هعد كده الInsulin
واتناء تدريب النموذج يكون الترتيب الGlucose وبعد كده الBMI و بعد كده الAge وطبعان الOutcome مش هنحسبو فا ازي كده ؟