Meezo ML

الأعضاء
  • المساهمات

    90
  • تاريخ الانضمام

  • تاريخ آخر زيارة

السُّمعة بالموقع

4 Neutral
  1. عندما أحاول حساب مصفوفة ال confusion matrix أحصل على الخطأ التالي: ValueError: Multilabel-indicator is not supported for confusion matrix علماً أن البيانات التي أريد بناء المصفوفة عليها هي من الشكل (One-Hot): [[1, 0, 0,0,0,0], [0, 0, 1,0,0,0], [0, 0, 0,0,1,0], [0, 0, 0,0,1,0] ... ]
  2. يظهر لي الخطأ التالي في هذا السطر: X,X_val, y, y_val=train_test_split(data,label,test_size=0.2,stratify=label) الخطأ: ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of groups for any class cannot be less than 2. مالسبب؟
  3. لدي كود بالشكل التالي: data = pd.read_csv('D:\\house.csv'); X = data['size'] y = data['price'] lr = LinearRegression() lr.fit(X,y) لكنه يعطيني الخطأ التالي: ValueError: Found input variables with inconsistent numbers of samples: [1, 1000] ما السبب؟ وما الحل؟
  4. أحاول تقسيم البيانات باستخدام StratifiedKFold لكن يظهر لي الخطأ التالي : import numpy as np from sklearn.model_selection import StratifiedKFold X = np.array([[1,4],[2,1],[3,4],[7,8],[2,8]]) y = np.array([2,1,3,4,4]) skf = StratifiedKFold(n_splits=3) print(skf.get_n_splits(X, y)) for train_index, test_index in skf.split(X, y): print("TRAIN:"+str(train_index)+'\n'+"TEST:"+str(test_index),end='\n\n') X_train, X_test = X[train_index], X[test_index] y_train, y_test = y[train_index], y[test_index] print('X_train:\n '+str(X_train),end='\n\n') print('X_test:\n '+str(X_test),end='\n\n') print('y_train:\n '+str(y_train),end='\n\n') print('y_test:\n' +str(y_test),end='\n\n') --------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-56-6c55afa3238f> in <module> 6 print(skf.get_n_splits(X, y)) 7 ----> 8 for train_index, test_index in skf.split(X, y): 9 # للتقسيمة index عرض ال 10 print("TRAIN:"+str(train_index)+'\n'+"TEST:"+str(test_index),end='\n\n') ~\anaconda3\lib\site-packages\sklearn\model_selection\_split.py in split(self, X, y, groups) 333 .format(self.n_splits, n_samples)) 334 --> 335 for train, test in super().split(X, y, groups): 336 yield train, test 337 ~\anaconda3\lib\site-packages\sklearn\model_selection\_split.py in split(self, X, y, groups) 78 X, y, groups = indexable(X, y, groups) 79 indices = np.arange(_num_samples(X)) ---> 80 for test_index in self._iter_test_masks(X, y, groups): 81 train_index = indices[np.logical_not(test_index)] 82 test_index = indices[test_index] ~\anaconda3\lib\site-packages\sklearn\model_selection\_split.py in _iter_test_masks(self, X, y, groups) 690 691 def _iter_test_masks(self, X, y=None, groups=None): --> 692 test_folds = self._make_test_folds(X, y) 693 for i in range(self.n_splits): 694 yield test_folds == i ~\anaconda3\lib\site-packages\sklearn\model_selection\_split.py in _make_test_folds(self, X, y) 661 raise ValueError("n_splits=%d cannot be greater than the" 662 " number of members in each class." --> 663 % (self.n_splits)) 664 if self.n_splits > min_groups: 665 warnings.warn(("The least populated class in y has only %d" ValueError: n_splits=3 cannot be greater than the number of members in each class. ماهو عدد الأعضاء؟ وكيف نحل المشكلة؟
  5. كيف نقوم بتقسيم البيانات باستخدام ShuffleSplit في مكتبة Sklearn، وكيف يتم الأمر؟
  6. كيف نقوم بتقسيم البيانات باستخدام LeavePOut في مكتبة Sklearn؟
  7. لماذا يظهر لي الخطأ التالي عند محاولة استيراد الكلاس Imputer: from sklearn.preprocessing import Imputer --------------------------------------------------------------------------- ImportError Traceback (most recent call last) <ipython-input-15-1ff1e063db9c> in <module> ----> 1 from sklearn.preprocessing import Imputer ImportError: cannot import name 'Imputer' from 'sklearn.preprocessing' (C:\Users\Windows.10\anaconda3\lib\site-packages\sklearn\preprocessing\__init__.py)
  8. قمت ببناء نموذج تصنيف باستخدام خوارزمية ExtraTrees لكنه يعطيني الخطأ التالي عندما يحاول عمل ال fitting على البيانات: clf = ExtraTreesClassifier(n_estimators=150, random_state=444) clf.fit(X_train, y_train) ---------------------------------------------------------------------- ValueError: Unknown label type: 'unknown' علماً أن قيم ال y طبيعية: y is array([1.0, 0.0, 0.0, ..., 1.0, 1.0, 0.0], dtype=object) size is (800,) ماهي المشكلة؟
  9. كيف نقوم بتقسيم البيانات باستخدام LeaveOneOut في مكتبة Sklearn؟
  10. استخدام الصف VarianceThreshold من Sklearn لحذف ال Features ذات التباين القليل (أغلب قيمها مكررة) حيث أنه لدي بيانات بوليانية لكن بعض ال Features فيها لديها تباين قريب من الصفر؟
  11. لدي مجموعة بيانات بقيم متطرفة وأريد توحيد قيم هذه البيانات (standardize ) باستخدام QuantileTransformer في مكتبة Sklearn لكي أحصل على نتائج أفضل، كيف يمكن أن أقوم بذلك؟
  12. كيف نقوم بتطبيق cross_val_score باستخدام مكتبة Sklearn لقياس كفاءة نماذج مختلفة عبر عدة Folds؟
  13. أثناء تعاملي مع مجموعة بيانات Titanic وأثناء تنفيذي لل LabelEncoder على الواصفة Embarked ظهر لي الخطأ التالي: TypeError: '>' not supported between instances of 'str' and 'float' ما الحل؟
  14. ظهر لي الخطأ التالي: 'TypeError: '>' not supported between instances of 'float' and 'str عند محاولتي تطبيق الكلاس LabelEncoder على أحد أعمدة ملف من نوع Dataframe، رغم أنه لايحوي قيم مفقودة؟