اذهب إلى المحتوى

السؤال

نشر

السلام عليكم

هو انا هنا لم عملت تحليل البيانات مرض السكري اكتشافة ان عمود زي الGlucose و HOMA_IR و الInsulin بالترتيب كده هما اكثر تاثير علي عمود الOutcome 

ملحوظه: عمود ده HOMA_IR انا العملو وهو العمود HOMA_IR يشير إلى مؤشر مقاومة الأنسولين (Homeostatic Model Assessment for Insulin Resistance).

بس وانا بتدريب النموذج ظهر عكس كده يعني مش بيتدريب كويس علي البيانات وكمان عمود الHOMA_IR مش بيقي اصلان موجود ؟

وده الكود ودي البيانات 

# SGDRegressor
modle_diabetes_sgdregressor = SGDRegressor(max_iter=1000, tol=1e-3 , penalty='l2' , random_state=42)

train = modle_diabetes_sgdregressor.fit(x_train_scaled , y_train)

y_predict = train.predict(x_test_scaled)

mean_squared_error_value = mean_squared_error(y_test , y_predict , multioutput='uniform_average')
print(f"Mean Squared Error Value: {mean_squared_error_value}")

importances = permutation_importance(modle_diabetes_sgdregressor , x_test_scaled , y_test , n_repeats=10 , random_state=42)
imprtance_scores = importances.importances_mean

sorted_features = np.argsort(imprtance_scores)[::-1]
print(f"Best: {diabetes.columns[sorted_features]}")

 

diabetes2.csv

Recommended Posts

  • 0
نشر

الكود الذي أرفقته لا يؤثر على العمود HOMA_IR و بالتالي ربما في جزء أخر من الكود هو المسؤول عن حذف العمود، أي ربما تم حذفه أثناء عملية المعالجة المسبقة للبيانات Preprocessing عن طريق الخطأ، لذا تحقق من وجود HOMA_IR في بيانات x_train_scaled و x_test_scaled بعد معالجة البيانات عن طريق هذا الكود:

print(x_train_scaled.columns) 

إذا لم يكن العمود موجود، فستحتاج إلى إضافته مرة أخرى قبل التدريب.

  • 0
نشر
بتاريخ 8 دقائق مضت قال Chihab Hedidi:

الكود الذي أرفقته لا يؤثر على العمود HOMA_IR و بالتالي ربما في جزء أخر من الكود هو المسؤول عن حذف العمود، أي ربما تم حذفه أثناء عملية المعالجة المسبقة للبيانات Preprocessing عن طريق الخطأ، لذا تحقق من وجود HOMA_IR في بيانات x_train_scaled و x_test_scaled بعد معالجة البيانات عن طريق هذا الكود:

print(x_train_scaled.columns) 

إذا لم يكن العمود موجود، فستحتاج إلى إضافته مرة أخرى قبل التدريب.

ايوه انا عملت كده وموجود عمود ال HOMA_IR ؟

  • 0
نشر
بتاريخ 33 دقائق مضت قال Ail Ahmed:

ايوه انا عملت كده وموجود عمود ال HOMA_IR ؟

أسباب المشكلة كثيرة، قد يكون HOMA_IR نظريا متغير مهم، ولكن العلاقة بينه وبين Outcome قد تكون غير خطية أو ضعيفة نسبيا، ونموذج SGDRegressor يعتمد على العلاقات الخطية، وبالتالي قد يفشل في التعرف على العلاقات غير الخطية، جرب نماذج تدعم العلاقات غير الخطية مثل Random Forest Regressor، أو Gradient Boosting Models مثل XGBoost.

  • 0
نشر
بتاريخ 3 ساعة قال Ail Ahmed:

تمام , جدا 

الف شكراا لحضرتك

انا عملت الكود ده بس ظهار عندي الخطاء ده ؟

AttributeError: 'numpy.ndarray' object has no attribute 'columns'

 

الخطأ الذي يظهر لديك يعني أن الكائن x_train_scaled هو مصفوفة، وليس كائن DataFrame من مكتبة Pandas، و المصفوفات في Numpy لا تحتوي على أسماء أعمدة، ولذلك لا يمكنك استخدام columns.

إذا كنت قد قمت بتقييس البيانات باستخدام مكتبة مثل StandardScaler من sklearn، فمن الطبيعي أن تكون النتيجة عبارة عن مصفوفة Numpy، و لجعل الأمور أسهل، يمكنك تحويل المصفوفة مرة أخرى إلى DataFrame باستخدام الأعمدة الأصلية:

import pandas as pd

x_train_scaled_df = pd.DataFrame(x_train_scaled, columns=x_train.columns)

print(x_train_scaled_df.columns)

 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...