إياد أحمد نشر 10 ديسمبر 2021 أرسل تقرير نشر 10 ديسمبر 2021 أعمل على مشروع تحليل مشاعر معتمد على الجانب لإحدى الشركات، وفي هذا النوع من المشاريع فإن الخطوة الأساسية هي تقسيم النص إلى جمل بعد ذلك استخراج وحدات الرأي من النص. لذا ما أحتاجه هنا هو دالة تقوم بتقسيم النص إلى جمل؟ 1 اقتباس
1 Ali Haidar Ahmad نشر 10 ديسمبر 2021 أرسل تقرير نشر 10 ديسمبر 2021 يمكنك استخدام الدالة sent_tokenize من NLTK لتقسيم النصوص إلى جمل، على سبيل المثال الجملة التالية: INPUT: "Life is like riding a bicycle. To keep your balance, you must keep moving."\ OUTPUT: 'Life is like riding a bicycle.' 'To keep your balance, you must keep moving.' الحل: # استيراد الوحدات import nltk from nltk.tokenize import sent_tokenize # تحديد النص txt = "Life is like riding a bicycle. To keep your balance, you must keep moving." # تقسيم النص إلى جمل sent = sent_tokenize(txt) print(sent) # ['Life is like riding a bicycle.', 'To keep your balance, you must keep moving.'] اقتباس
-1 Ahmed Sharshar نشر 10 ديسمبر 2021 أرسل تقرير نشر 10 ديسمبر 2021 يمكنك كذلك استخدام tokenize لتقسيم الجمل بشكل تلقائي كالتالي: #تحميل المكتبة import nltk.data #تحميل ملف النص tokenizer = nltk.data.load('tokenizers/punkt/english.pickle') fp = open("test.txt") data = fp.read() #فصل الملف الى جمل print ('\n-----\n'.join(tokenizer.tokenize(data))) اقتباس
السؤال
إياد أحمد
أعمل على مشروع تحليل مشاعر معتمد على الجانب لإحدى الشركات، وفي هذا النوع من المشاريع فإن الخطوة الأساسية هي تقسيم النص إلى جمل بعد ذلك استخراج وحدات الرأي من النص. لذا ما أحتاجه هنا هو دالة تقوم بتقسيم النص إلى جمل؟
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.