اذهب إلى المحتوى

السؤال

نشر

السلام عليكم 

وشكرا للقائمين على الموقع ونفع الله بهم دائما

قمت ببناء مودل دريته على قاعدة بيانات 80% ثم اختبرته على 20% قمت بفصلها مسبقا من الأول unseen وحقق نسبة جيدة باستعمال مصفوفة الارتباك confusion

الآن أريد تجربته على بيانات جديدة مهيأة بنفس حالة البيانات التي درب عليها المودل

وأود أن أرى عمل المودل عليها

السؤال: لأتحقق من عمله هل علي المراجعة اليدوية؟ أم أن هناك مقاييس أداء جاهزة؟ هل هناك غير مقياس الصحة؟ باختصار كيف أقيس أدائه وأن لم أقم بعمل tagging للبيانات مسبقا؟

 

وشكرا مقدما

Recommended Posts

  • 1
نشر

لأول مرة أسمع بمصطلح مقياس الصحة ولا اظن أنه موجود أو من الممكن أن هناك مشكل في الترجمة.

من ناحية أخرى حتى تتأكد من قدرة الموديل عليك من الأول أن تقسم dataset على 3 أقسام

  • قسم training
  • قسم validation
  • قسم test

حتى تتأكد من قدرته بشكل كلي أو أن تأتي ب data جديدة إما بالويب سكرابينغ أو أداة أخرى تجمع بها بيانات لم يتدرب عليها الموديل فتفحصه بها، علما أن نتيجة validation كافية في حالتك.

بالنسبة لمقياسات أخرى هناك الكثير منها اتركك مع هذه المقالة لتحصل منها على شرح وافٍ ومتى نستعمل هذا المقياس ومتى نستعمل الأخر.

  • 0
نشر
بتاريخ 59 دقائق مضت قال Arabic Language:

الحقيقة بعد شكري لك

أن الهدف ليس قياس المودل وإنما تطبيقه على نصوص أخرى وتقديمها للمهتم

لكني أود تصحيحها وأود أيضا حساب نسبة الخطأ

 

فهل حساب الخطأ يكون بالاكيورسي فقط؟ 

 

ال accuracy كافٍ، يكون هو الأساس. لا نريد تحقيق 100% في تدريب المودل ولكن نريد تحقيقها أثناء تجربته ومحاولة التكرار حتى الوصول إليها وهذا ما يسمى ب avoid overfitting.

  • 0
نشر
بتاريخ 3 ساعات قال Arabic Language:

طيب أستاذي إذا كانت البياناتضخمة فهل يعقل أن أقوم بمراجعتها يدويا حتى أظهر قيمة الاكيورسي ؟ ألا تستعمل منهجية أخرى هنا؟ عندي آلاف الكلمات لا بد أن أمر عليها

هل يمكنك تزويدنا بتفاصيل أكثر عن المشروع ..

لغة البرمجة و أي تفاصيل مفيدة

  • 0
نشر
بتاريخ 6 ساعات قال Arabic Language:

طيب أستاذي إذا كانت البياناتضخمة فهل يعقل أن أقوم بمراجعتها يدويا حتى أظهر قيمة الاكيورسي ؟ ألا تستعمل منهجية أخرى هنا؟ عندي آلاف الكلمات لا بد أن أمر عليها

لا يوجد شيئ يدوي يا أخي من الممكن أن تحصل على data prediction مهما كانت كبيرة فقط بعد تحميل load للموديل وبعدها إحصل على test predict ثم قارنها مع y_true في confusion matrix.

  • 0
نشر

أخي الكريم المودل قيمته وانتهيت وكان على اللغة العربية خليط فصحى تراث ومعاصرة

الآن أريد أن أجرب هذا المودل على بيانات تراث فقط وليس عندي نسخة test 

لذلك ما زال سؤال هل الأكيورسي والمراجعة اليدوية هي الحل الوحيد؟

المشروع عبارة عن part of speech tagger بالبايثون 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...