اذهب إلى المحتوى

السؤال

نشر

السلام عليكم

هو اختبار Cramér's V بستخدم الدله max والا min عشان احصل علي قيمه k ؟ 

دي الكود

 # Create a contingency table using the specified columns from the dataset ('data1' and 'data2').
    contingency_table = pd.crosstab(data_train[data1], data_train[data2])

    # Perform the Chi-squared test using the contingency table.
    chi2_stat, p_value, dof, expected = chi2_contingency(contingency_table)

    # Calculate Cramér's V
    n = np.sum(contingency_table)  # Total number of observations
    print(n)
    k = min(contingency_table.shape)  # Use the largest dimension of the table to calculate Cramér's V
    v = np.sqrt(chi2_stat / (n * (k - 1)))

 

Recommended Posts

  • 0
نشر

وعليكم السلام ورحمة الله وبركاته.

للحصول على قيمة k في اختبار Cramér's V و التي تمثل الحد الأدنى بين أبعاد جدول التوزيع المشترك contingency table يجب أن نستخدم الدالة min وليست max.

وهذا لأن Cramér's V يعتمد على العدد الأصغر بين الأبعاد (عدد الصفوف وعدد الأعمدة) في جدول التوزيع المشترك contingency table .لهذا ما قمت به صحيح min(contingency_table.shape) .

وإليك صيغة القانون الخاصة به :

image.png.019b94e7b18e42a9289e02f2d0fcc460.png

  • 0
نشر

الدالة min، لأنّ قيمة k يتم حسابها باستخدام الدالة min على أبعاد جدول التوافق contingency_table، حيث K تمثل عدد الصفوف أو الأعمدة الأقل في جدول التوافق، أي  هي الأبعاد الأصغر للجدول.

وللعلم Cramér's V هو مقياس لقوة الارتباط بين متغيرين اسميين categorical variables، ويتم حسابه حسب إحصائية مربع كاي Chi-squared statistic.

وفي حساب Cramér's V، نقسم إحصائية مربع كاي على قيمة تعتمد على حجم العينة وعدد الفئات في المتغيرات، بالتالي استخدام min يضمن أننا نستخدم الأبعاد الأصغر للجدول، مما يؤدي إلى قيمة Cramér's V تتراوح بين 0 و 1.

وفي حال استخدمت max بدلاً من min، فإن قيمة Cramér's V قد تتجاوز 1، وذلك غير صحيح، ويفضل استخدام الحد الأدنى من الأبعاد min بدلاً من الحد الأقصى max لأنها توفر تقديرًا أكثر دقة لمعامل الارتباط.

  • 0
نشر
بتاريخ 4 دقائق مضت قال Mustafa Suleiman:

الدالة min، لأنّ قيمة k يتم حسابها باستخدام الدالة min على أبعاد جدول التوافق contingency_table، حيث K تمثل عدد الصفوف أو الأعمدة الأقل في جدول التوافق، أي  هي الأبعاد الأصغر للجدول.

وللعلم Cramér's V هو مقياس لقوة الارتباط بين متغيرين اسميين categorical variables، ويتم حسابه حسب إحصائية مربع كاي Chi-squared statistic.

وفي حساب Cramér's V، نقسم إحصائية مربع كاي على قيمة تعتمد على حجم العينة وعدد الفئات في المتغيرات، بالتالي استخدام min يضمن أننا نستخدم الأبعاد الأصغر للجدول، مما يؤدي إلى قيمة Cramér's V تتراوح بين 0 و 1.

وفي حال استخدمت max بدلاً من min، فإن قيمة Cramér's V قد تتجاوز 1، وذلك غير صحيح، ويفضل استخدام الحد الأدنى من الأبعاد min بدلاً من الحد الأقصى max لأنها توفر تقديرًا أكثر دقة لمعامل الارتباط.

حمدالله علي السلام كانت لسه هسال علي حضرتك

تمام , جدا

الف شكرااا جدا جدا لحضرتكم

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...