اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

تشابه جاكارد "Jaccard Similarity"؛ هو مقياس تشابه يُستخدم لتحديد مدى تشابه نقطتي بيانات مع بعضهما البعض. وفي تعريف آخر؛ هو مقياس يقيس التشابه بين مجموعتين من البيانات، وتتراوح قيمته من 0 إلى 1. وكلما زاد الرقم، زاد تشابه مجموعتي البيانات. ويعبر عنه بالشكل:

Jaccard Similarity = (number of observations in both sets) / (number in either set)
# أي هو مجموعة الأرقام التي ظهرت في كلتا المجموعتين على عدد الأرقام كلها
# أو بالعلاقة
J(A, B) = |AB| / |AB|

ويمكن تمثيل ذلك في دالة في بايثون:

def jaccard(list1, list2):
    intersection = len(list(set(list1).intersection(list2)))
    union = (len(list1) + len(list2)) - intersection
    return float(intersection) / union

 

مثال:

import numpy as np
# لدينا نقطتي البيانات التاليتين
a = [0, 1, 2, 5, 6, 8, 9]
b = [0, 2, 3, 4, 5, 7, 9]
# حساب نسبة التشابه بين المجموعتين
jaccard(a, b)
# 0.4

 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...