MaxReve نشر 3 نوفمبر 2015 أرسل تقرير نشر 3 نوفمبر 2015 أريد تقسيم سلسلة نصية بها نص إلى قائمة حيث كل عنصر من عناصر هذه القائمة يتكون من كلمة من النص، أي أنني أريد تقسيم السلسلة النصية إلى عدد كلماتها وذلك ضمن قائمة، فما هي الشيفرة البرمجية اللازمة لفعل ذلك في بايثون؟ اقتباس
0 هشام رزق الله نشر 3 نوفمبر 2015 أرسل تقرير نشر 3 نوفمبر 2015 هنالك عدة طرق لفعل ذلك في لغة بايثون، فيمكنك مثلا استخدام الدالة المدمجة split() والتي ستخزن كل كلمة ضمن عنصر قائمة، ولن تحتاج إلى كتابة أي شيفرة برمجية ولا أي حلقة تكرار:words = text.split() يمكنك أيضا تعيين محدد معين مثل ",” لتقسيم السلسلة النصية إلى أجزاء حسب هذه المعين كما في المثال التالي:words = text.split(",") وإذا أردت استخدام دالة أخرى فيمكن استخدام word_tokenize من مكتبة nltk حيث ستُمرر السلسلة النصية التي ترغب بتقسيمها كما في split():>>> import nltk >>> s = "The fox's foot grazed the sleeping dog, waking it." >>> words = nltk.word_tokenize(s) >>> words ['The', 'fox', "'s", 'foot', 'grazed', 'the', 'sleeping', 'dog', ',', 'waking', 'it', '.'] المصدر اقتباس
0 Ali Haidar Ahmad نشر 1 أبريل 2022 أرسل تقرير نشر 1 أبريل 2022 الأداة الأفضل لإنجاز ذلك هي مكتبة التعابير المنتظمة re. حيث تمنحك حرية كاملة في تحديد أسس التقسيم التي تريدها. مثال: تقسيم سلسلة نصية على أساس الفراغات الفاصلة بين الكلمات. import re re.split('\s+', 'Please split this string') # ['Please', 'split', 'this', 'string'] اقتباس
السؤال
MaxReve
أريد تقسيم سلسلة نصية بها نص إلى قائمة حيث كل عنصر من عناصر هذه القائمة يتكون من كلمة من النص، أي أنني أريد تقسيم السلسلة النصية إلى عدد كلماتها وذلك ضمن قائمة، فما هي الشيفرة البرمجية اللازمة لفعل ذلك في بايثون؟
2 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.