اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

وعليكم السلام ورحمة الله وبركاته،

دالة crosstab في pandas هي أداة قوية لتحليل البيانات تستخدم لإنشاء جداول تقاطعية تظهر العلاقة بين متغيرين أو أكثر في مجموعة البيانات بحيث تقوم الدالة بحساب التكرارات أو القيم المجمعة عند تقاطع المتغيرات ويمكن استخدامها مع خيارات متعددة مثل margins=True لإضافة المجاميع الكلية، وnormalize=True لعرض النسب المئوية بدلا من العدد على سبيل المثال يمكننا تحليل مبيعات المنتجات حسب المنطقة، أو تصنيف العملاء حسب الفئة العمرية والجنس والصيغة الأساسية للدالة هي:

pd.crosstab(index, columns, values=None, aggfunc=None)

حيث index وcolumns هما المتغيران المراد تحليل علاقتهما، وvalues هو عمود القيم المراد تجميعها وهو اختياري بينما aggfunc هي دالة التجميع المستخدمة مثل sum أو mean وهذه الدالة مفيدة بشكل خاص في التحليل الإحصائي وتحليل البيانات الاستكشافي.

  • 0
نشر

الدالة crosstab في مكتبة Pandas تستخدم لإنشاء جداول تقاطع، و تظهر العلاقة بين متغيرين أو أكثر بطريقة منظمة وسهلة الفهم، و تعمل على عد التكرارات لكل مزيج من القيم بين الأعمدة والصفوف، كما يمكنها تلخيص القيم باستخدام دوال إحصائية مثل المجموع أو المتوسط عبر معامل aggfunc، و تعتبر أداة قوية لتحليل البيانات واستخراج التوزيعات أو الأنماط، مع إمكانية إضافة مجاميع الصفوف والأعمدة، وتطبيع النتائج إلى نسب مئوية، و تستخدم بشكل شائع في استكشاف البيانات واستخراج إحصائيات تلخيصية لتقديم رؤى واضحة عن العلاقات بين المتغيرات.

  • 0
نشر

وعليكم السلام ورحمة الله وبركاته.

الدالة crosstab تقوم بإنشاء جدول تقاطع (Cross Tabulation Table) وهو جدول تكراري يساعد في تلخيص البيانات وتصنيفها بناء على عدة متغيرات.

وتستقبل الدالة العديد من المعاملات :

 

  • index: وهي القيم التي يتم إستخدامها كمحور للصفوف (rows).
  • columns: القيم التي يتم إستخدامها كمحور للأعمدة (columns).
  • normalize: إذا كانت True، يتم تطبيع القيم (عرض القيم كنسب مئوية).
  • dropna: يتم حذف القيم الفارغة (NaN) إذا تم تمرير True لهذا المعامل.

وتستخدم في العديد من الأمور مثل حساب التكرارات للقيم لديك و أيضا عمل تجميع (aggregate) للقيم لديك .

ويمكنك قراءة التوثيق الرسمي لها لمزيد من التفاصيل :

  • 0
نشر

دالة crosstab هي أداة مفيدة جدا لتحليل البيانات وإنشاء جداول تقاطعية (جداول محورية) وتستخدم لحساب تكرار العلاقات بين متغيرين أو أكثر في البيانات والاستخدام الأساسي للدالة كالتالي:

pd.crosstab(index, columns)

وهذا مثال لنفترض التالي:

import pandas as pd

data = {
    'النوع': ['ذكر', 'أنثى', 'ذكر', 'أنثى', 'ذكر'],
    'المدينة': ['القاهرة', 'الإسكندرية', 'القاهرة', 'القاهرة', 'الإسكندرية']
}

df = pd.DataFrame(data)

result = pd.crosstab(df['النوع'], df['المدينة'])
print(result)

والناتج سيكون جدول يوضح كم عدد الذكور والإناث في كل مدينة بحيث الصفوف تمثل النوع والأعمدة تمثل المدينة أين يمكنك حساب النسب المئوية:

pd.crosstab(df['النوع'], df['المدينة'], normalize='index')

إضافة هوامش المجاميع:

pd.crosstab(df['النوع'], df['المدينة'], margins=True)

تطبيق دوال حسابية مختلفة:

pd.crosstab(df['النوع'], df['المدينة'], values=df['العمر'], aggfunc='mean')

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...