اذهب إلى المحتوى
  • 0

البحث عن الأسماء باستخدام Nltk في بايثون

Karem

السؤال

هل هناك أي طريقة للعثور على أسماء العلم وال Possessive Nouns باستخدام NLTK ؟  حيث أنه لدي نصوص وأريد استخراج أسماء العلم وال Possessive Nouns منها؟

تم التعديل في بواسطة Karem
رابط هذا التعليق
شارك على الشبكات الإجتماعية

Recommended Posts

  • 0

نعم في Nltk يمكنك استخدام Part-Of-Speech tagger (pos_tag)، حيث أن ماتطلبه ينتمي إلى فئة NNP.

# التي تقوم بتصنيف الكلمات pos_tag استيراد الوحدة
from nltk.tag import pos_tag
# تحديد الجملة
sentence = "Ali Ahmed wishes to travel outside Syria in any way "
# tokens نقوم الآن بتقسيم النص إلى وحدات
tokens=sentence.split()
# تصنيفها النحوي
post = pos_tag(tokens)
# [('Ali', 'NNP'), ('Ahmed', 'NNP'), ('wishes', 'VBZ'), ('to', 'TO'), ('travel', 'VB'),('outside', 'JJ'), ('Syria', 'NNP'), ('in', 'IN'), ('any', 'DT'), ('way', 'NN')]
# NNP استخلالص ال 
pnouns = [word for word,pos in post if pos == 'NNP']
# ['Ali', 'Ahmed', 'Syria']

 لإيجاد ال Possessive Nouns سنأخذ فقط الأسماء التي تنتهي ب " 's " أو " s' " وهنا يمكننا أن نستخدم الدالتين:

str.endswith("'s")
str.endswith("s'")

أي:

# التي تقوم بتصنيف الكلمات pos_tag استيراد الوحدة
from nltk.tag import pos_tag
# تحديد الجملة
sentence = "Ali Ahmed wishes to travel outside Syria in any way "
# tokens نقوم الآن بتقسيم النص إلى وحدات
tokens=sentence.split()
# تصنيفها النحوي
post = pos_tag(tokens)
# [('Ali', 'NNP'), ('Ahmed', 'NNP'), ('wishes', 'VBZ'), ('to', 'TO'), ('travel', 'VB'),('outside', 'JJ'), ('Syria', 'NNP'), ('in', 'IN'), ('any', 'DT'), ('way', 'NN')]
# NNP استخلالص ال 
pnouns = [word for word,pos in post if pos == 'NNP']
# ['Ali', 'Ahmed', 'Syria']
sentence = "Ali took Daniel Jackson's hamburger and Agnes' fries"
possessives = [word for word in sentence.split() if word.endswith("'s") or word.endswith("s'")]
possessives
# ["Jackson's", "Agnes'"]

 

رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...