اذهب إلى المحتوى

السؤال

نشر (معدل)

هل هناك أي طريقة للعثور على أسماء العلم وال Possessive Nouns باستخدام NLTK ؟  حيث أنه لدي نصوص وأريد استخراج أسماء العلم وال Possessive Nouns منها؟

تم التعديل في بواسطة Karem

Recommended Posts

  • 0
نشر

نعم في Nltk يمكنك استخدام Part-Of-Speech tagger (pos_tag)، حيث أن ماتطلبه ينتمي إلى فئة NNP.

# التي تقوم بتصنيف الكلمات pos_tag استيراد الوحدة
from nltk.tag import pos_tag
# تحديد الجملة
sentence = "Ali Ahmed wishes to travel outside Syria in any way "
# tokens نقوم الآن بتقسيم النص إلى وحدات
tokens=sentence.split()
# تصنيفها النحوي
post = pos_tag(tokens)
# [('Ali', 'NNP'), ('Ahmed', 'NNP'), ('wishes', 'VBZ'), ('to', 'TO'), ('travel', 'VB'),('outside', 'JJ'), ('Syria', 'NNP'), ('in', 'IN'), ('any', 'DT'), ('way', 'NN')]
# NNP استخلالص ال 
pnouns = [word for word,pos in post if pos == 'NNP']
# ['Ali', 'Ahmed', 'Syria']

 لإيجاد ال Possessive Nouns سنأخذ فقط الأسماء التي تنتهي ب " 's " أو " s' " وهنا يمكننا أن نستخدم الدالتين:

str.endswith("'s")
str.endswith("s'")

أي:

# التي تقوم بتصنيف الكلمات pos_tag استيراد الوحدة
from nltk.tag import pos_tag
# تحديد الجملة
sentence = "Ali Ahmed wishes to travel outside Syria in any way "
# tokens نقوم الآن بتقسيم النص إلى وحدات
tokens=sentence.split()
# تصنيفها النحوي
post = pos_tag(tokens)
# [('Ali', 'NNP'), ('Ahmed', 'NNP'), ('wishes', 'VBZ'), ('to', 'TO'), ('travel', 'VB'),('outside', 'JJ'), ('Syria', 'NNP'), ('in', 'IN'), ('any', 'DT'), ('way', 'NN')]
# NNP استخلالص ال 
pnouns = [word for word,pos in post if pos == 'NNP']
# ['Ali', 'Ahmed', 'Syria']
sentence = "Ali took Daniel Jackson's hamburger and Agnes' fries"
possessives = [word for word in sentence.split() if word.endswith("'s") or word.endswith("s'")]
possessives
# ["Jackson's", "Agnes'"]

 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...