اذهب إلى المحتوى
  • 0

كيف تتحقق مما إذا كانت الكلمة هي كلمة إنجليزية باستخدام NLTK في بايثون؟

إياد أحمد

السؤال

أقوم ببعض عمليات المعالجة على نصوص، وأحتاج إلى طريقة لتحديد فيما إذا كانت الكلمة تنتمي إلى اللغة الإنجليزية أم لا، حيث أنه في حال كانت تنتمي للغة أريد القيام بشيء محدد، وإلا شيء آخر.. 

رابط هذا التعليق
شارك على الشبكات الإجتماعية

Recommended Posts

  • 1

يمكنك استخدام الدالة words المعرّفة ضمن الوحدة nltk.corpus.words، حيث تعيد لك هذه الدالة قائمة تحوي جميع الكلمات الإنجليزية تقريباً، وبالتالي يمكنك استخدامها واختبار انتماء كلمة لمجموعة المفردات الإنجليزية من خلال المعامل in كما يلي:

from nltk.corpus import words
"can" in words.words()
# True
"try" in words.words()
# True
"I" in words.words()
# True

وكحالة خاصة يمكنك استخدام المكتبة PyEnchant المتخصصة بالتدقيق الإملائي بالشكل التالي:

# استيراد المكتبة
import enchant
# وبالتالي يعطيك قاموساً بكل الكلمات الانجليزية en_US القيمة enchant المعرفة ضمن المكتبة Dict نمرر للدالة 
words = enchant.Dict("en_US")
# لاختبار انتماء كلمة لهذا المعجم check ثم نستخدم الدالة 
words.check("can")
# True

 

رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...