إياد أحمد نشر 16 ديسمبر 2021 أرسل تقرير نشر 16 ديسمبر 2021 كيف بإمكاننا حذف الكلمات المكررة من النص مثلاً: Hiiiiiiiiiiiii --> Hi 1 اقتباس
1 Ali Haidar Ahmad نشر 16 ديسمبر 2021 أرسل تقرير نشر 16 ديسمبر 2021 يمكنك القيام بذلك من خلال wordnet و الوحدة regex في بايثون، فيما يلي سأقوم ببناء كلاس يمكنك استخدامه لحذف الحروف المكررة من أي نص: # nltk و regex سنستخدم مكتبيتي import re from nltk.corpus import wordnet # سأقوم بتعريف كلاس يمكنك استخدامه لحذف الأحرف المكررة من أي نص class Rep_word_removal(object): def __init__(self): self.repeat_regexp = re.compile(r'(\w*)(\w)\2(\w*)') self.repl = r'\1\2\3' def replace(self, word): if wordnet.synsets(word): return word replace_word = self.repeat_regexp.sub(self.repl, word) if replace_word != word: return self.replace(replace_word) else: return replace_word الاستخدام: # لاستخدامه # أنشئ كائن من هذا الكلاس rep_word = Rep_word_removal() rep_word.replace ("hiiiiii i am soooooooooo happy") # hi i am so hapy اقتباس
السؤال
إياد أحمد
كيف بإمكاننا حذف الكلمات المكررة من النص مثلاً:
Hiiiiiiiiiiiii --> Hi
1 جواب على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.