• 0

التشابه التوزيعي

مرحبا للجميع

يستعمل التشابه التوزيعي لحل مشكلات تصنيف الكلام إلى اسم وفعل وحرف إذا كانت البيانات قليلة وتكرارات الحرف مثلا صفرية أو منخفضة

هل أحد لديه فكرة عن آلية ذلك فقط الآلية دون الكود ؟

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 1

تقنيا حسب خبرتي في مجال Data Science غالبا ما يتم إستعمال ادوات لدراسة التباعد والتقارب بين البيانات في مجال سواء تحليل البيانات أو التنقيب عنها او في علوم البيانات ككل، فكمثال نعتبر اننا نستعمل فقط Regression classification ونريد أن نرى هل يوجد إرتباط بين البيانات أم لا حتى لا نقع في مشكلة متغير له علاقة بمتغير أخر كمثال قد نجد أن هناك علاقة بين X1 و X2 على الشكل التالي:

X1 = 5*X2

وبالتأكيد لحظة التصنيف هذا الشيئ سيؤثر بشكل سلبي على التصنيف ولن نحصل على دقة 100% بسهولة، لأجل ذلك يجب حذف X2 الذي تم استكشافه عن طريق التباعد بين البيانات ونترك في inputs فقط X المستقلة, ستساعدك كثيرا مكتبة pandas الموجودة في البايثون لتحليل البيانات.

تحياتي.

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 0

يوجد أداة برمجية تُستخدم في عدة لغات برميجة تُسمى A Part-Of-Speech Tagger (POS Tagger).

  •  A Part-Of-Speech Tagger (POS Tagger) : عبارة عن برنامج يقرأ النص المكتوب و يُجزء الكلام بناءًا على الإسم أو الفعل أو الصفة.

يُمكنك الإطلاع على هذه الأداة و المزيد حولها من خلال الموقع الرسمي لها، من هُنا.

بالإضافة لشرح آخر حول إستخدام هذه الأداة في الجافا، هُنا.

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 0

نعم أخي الكريم ولكن لو جربت تطبيقها على نص لم تدرب عليه سيحدث هناك أخطاء في بعض أقسام الكلام بسبب وجود كلمات غير معروفة لم يدرب عليها النموذج، ومن ثم التشابه التوزيعي سيساعد في التخلص من وقوع النموذج في هذه الأخطاء ولكن السؤال كيف؟

 

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 0
بتاريخ 22 ساعات قال Arabic Language:

نعم أخي الكريم ولكن لو جربت تطبيقها على نص لم تدرب عليه سيحدث هناك أخطاء في بعض أقسام الكلام بسبب وجود كلمات غير معروفة لم يدرب عليها النموذج، ومن ثم التشابه التوزيعي سيساعد في التخلص من وقوع النموذج في هذه الأخطاء ولكن السؤال كيف؟

 

كيف ؟ الإجابة بسيطة ولا علاقة للبيانات المدربة مع البيانات الغير مدربة لأن ما نقوم به الأن هو Data preprocessing و الهدف الأول والأخير هل الحصول على موديل بدقة عالية من دون تواجد ولا X واحد له علاقة ب X أخر، ولتستكشف ذلك كل ما عليك هو إستعمال pandas ودراسة ذلك، الفيديو التالي سيوضح لك كيف ستقوم بذلك.

1 شخص أعجب بهذا

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة

يجب أن تكون عضوًا لدينا لتتمكّن من التعليق

انشاء حساب جديد

يستغرق التسجيل بضع ثوان فقط


سجّل حسابًا جديدًا

تسجيل الدخول

تملك حسابا مسجّلا بالفعل؟


سجّل دخولك الآن