اذهب إلى المحتوى
  • 0

كيف نقوم بعمل Scaling على ال Dataset - بايثون

Areeg Abdulah

السؤال

Recommended Posts

  • 0

هناك طرق كثيرة ويمكنك استخدام المكتبة Sikit-Learn لتنفيذها مباشرة:

1.Standardization: وهي العملية الأكثر شهرة , وفيها يتم طرح القيمة ناقص ال mean مقسومة علي الانحراف المعياري std.

# StandardScaler استيراد الصف 
from sklearn.preprocessing import StandardScaler

# القيام بعملية التقييس
StandardSca = StandardScaler(copy=True)  #StandardScaler تعريف غرض من الصف 
# copy=True لكي لايعدل على البيانات الأساسية أي سينشئ نسخة عن البيانات ويطبق عليها التقييس 
data = StandardSca.fit_transform(data) # StandardScaler استدعاء التابع الذي ينفذ عملية التقييس من الصف 

2.MinMaxScaler: يتم فيه طرح القيمة من المتوسط وتقسم على المدى (الفرق بين أكبر وأصغر قيمة) وتكون القيم الجديدة بين 0 و 1.

#MinMaxScaler استيراد الصف 
from sklearn.preprocessing import MinMaxScaler

MinMaxSc = MinMaxScaler(copy=True, feature_range=(0, 1)) # يمكننا تغيير المجال
data = MinMaxSc.fit_transform(data)

3.Binarizer: تقوم بتحويل القيم إلى 0 أو ، بناءان على قيمة العتبة threshold الممرة

from sklearn.preprocessing import Binarizer

Binarize = Binarizer(threshold = value)
data = Binarize.fit_transform(data)

4.Normalizer: مخصصة لتناول كل صف علي حدة في المصفوفات ثنائية الأبعاد.

from sklearn.preprocessing import Normalizer




Normalize = Normalizer(copy=True, norm='l2') #  max يمكنك تغيير النورم الى 11 أو 
data = Normalize.fit_transform(data)

5.FunctionTransformer:  للقيام  بالتقييس باستحدام دالة نعرفها بأنفسنا.

from sklearn.preprocessing import FunctionTransformer


'''
FunctionTransformer(func=None, inverse_func=None, validate= None,
                    accept_sparse=False,pass_y='deprecated', check_inverse=True,
                    kw_args=None,inv_kw_args=None)
'''

scaler = FunctionTransformer(func = lambda x: x**2,validate = True) 
data = scaler.fit_transform(data)

 

تم التعديل في بواسطة Ali Haidar Ahmad
رابط هذا التعليق
شارك على الشبكات الإجتماعية

  • 0

يمكننا الاعتماد على المكتبة Scikit-learn لعمل Scale للبيانات:

# تضمين pandas
import pandas as pd

# تضمين حزمة StandardScaler
from sklearn.preprocessing import StandardScaler
  
# قراءة البيانات من ملف CSV
data = read_csv('Geeksforgeeks.csv')
data.head()
  
# تهيئة Scaler
scaler = StandardScaler()
  
# scale data
scaler.fit(data)

StandardScaler هو المعيار الافتراضي يتعلق بالوسيط في البيانات mean

رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...