اذهب إلى المحتوى

السؤال

نشر

لدي مجموعة من وثائق جوجل أريد كتابتها إلى ملف نصي لكنها تحتوى على رموز ليست من نوع ASCII، فكيف أستطيع تحويل هذه الرموز حتى أستطيع استخدامها في ملف مصدري من نوع HTML؟

Recommended Posts

  • 0
نشر

هنالك عدة طرق للتعامل مع مشكلة ترميز النصوص في بايثون، فيمكنك مثلًا ترميز هذه النصوص إلى unicode (كما ذكرت أنت) ومن ثم إعادتهم إلى حالتهم الأصلية عند فك الترميز.
إذا كانت سلسلتك النصية كائن unicode، فستحتاج إلى تحويلها إلى كائن سلسلة unicode مُرمزة قبل أن تكتبها إلى ملف كما في المثال التالي:

foo = u'Δ, Й, ק, ‎ م, ๗, あ, 叶, 葉, and 말.'
f = open('test', 'w')
f.write(foo.encode('utf8'))
f.close()

وعندما تحتاج إلى قراءة الملف لاحقا، يمكنك فك ترميز هذه النصوص كما يظهر في المثال التالي:

f = file('test', 'r')
print f.read().decode('utf8')

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...