هناك العديد من الطرق للقيام بعملية tokenizing للنص في nltk على سبيل المثال:
from nltk.tokenize import word_tokenize
text ='''I'll be there within 5 min.'''
word_tokenize(text)# ['I', "'ll", 'be', 'there', 'within', '5', 'min', '.']
لكن ماذا عن العملية العكسية أي Untokenize، كيف نقوم بذلك؟
السؤال
إياد أحمد
هناك العديد من الطرق للقيام بعملية tokenizing للنص في nltk على سبيل المثال:
لكن ماذا عن العملية العكسية أي Untokenize، كيف نقوم بذلك؟
1 جواب على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.