اذهب إلى المحتوى
  • 0

توحيد البيانات (standardize ) باستخدام QuantileTransformer في مكتبة Sklearn

Meezo ML

السؤال

لدي مجموعة بيانات بقيم متطرفة وأريد  توحيد قيم هذه البيانات (standardize ) باستخدام QuantileTransformer في مكتبة Sklearn لكي أحصل على نتائج أفضل، كيف يمكن أن أقوم بذلك؟

رابط هذا التعليق
شارك على الشبكات الإجتماعية

Recommended Posts

  • 1

يمكنك استخدام الكلاس QuantileTransformer من الموديول:

sklearn.preprocessing.QuantileTransformer

في المثال التالي سأوضح لك الأمر:

قمت بإنشاء مجموعة بيانات صغيرة موزعة توزيعاً غاوصياً، ثم قمت بجعل قيم هذه البيانات متطرفة عن طريق إدخالها بتابع أسي، ثم بعد ذلك سنطبق التحويل QuantileTransformer لكي نعيد نوحيد البيانات وجعلها موزعة توزيعاً موحداً uniform.

from numpy.random import randn
from sklearn.preprocessing import QuantileTransformer
from numpy import exp
from matplotlib import pyplot
# توليد بيانات غاوصية
data = randn(2000)
# نغير القيم في بياناتنا بحيث نجعل قيمها متطرفة
data = exp(data)
# نرسك شكل البيانات بعد جعلها متطرفة
pyplot.hist(data, bins=50)
pyplot.show()
# عمل إعادة تعيين لأبعاد البيانات للحصول على أسطر وأعمدة
data = data.reshape((len(data),1))
#quantile transform  تطبيق تحويل 
quantile = QuantileTransformer(n_quantiles=2000,output_distribution='uniform',copy=True)
data = quantile.fit_transform(data)
# عرض شكل البيانات بعد تطبيق التحويل
pyplot.hist(data, bins=50)
pyplot.show()

الوسيط الأول: عدد الكميات المطلوب حسابها. إنه يتوافق مع عدد المعالم المستخدمة لتحديد دالة التوزيع التراكمي. إذا كانت n_quantiles أكبر من عدد العينات ، فسيتم تعيين n_quantiles على عدد العينات نظرًا لأن عددًا أكبر من الكميات لا يعطي تقديرًا تقريبيًا أفضل لمقدر دالة التوزيع التراكمي. افتراضياً 1000.
الوسيط الثاني: لتحديد نظام توحيد البيانات المطلوب (إما توزيع طبيعي-غاوصي- أو توزيع موحد كما في مثالنا) أي إما normal أو uniform.
الثالث: لكل لايتم تطبيق التغييرات على البيانات الأساسية.
Untitled.thumb.png.e19d35802065a7353370b1e80e781167.png

رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...