اذهب إلى المحتوى
  • 0

خطأ 'charmap' codec can't encode characters في مكتبة Beautifull soup في  بايثون

Mohssen A Mohssen

السؤال

عندما أحاول سحب بعض البيانات من الإنترنت من خلال الكود التالي:

import urllib.request
from bs4 import BeautifulSoup

URL = "https://www.example.com/"
res = urllib.request.urlopen(URL)
html = res.read()

soup = BeautifulSoup(html)
print(soup)

يظهر لي الخطأ التالي:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 70924-70950: character maps to <undefined>

المشكلة أن هذا الخطأ يظهر في بعض الأحيان فقط وليس دائمًا ولا أدري سبب المشكلة، أيضًا تحدث نفس المشكلة عندما أحاول حفظ كود HTML في ملف جديد.

كيف أحل هذه المشكلة؟

رابط هذا التعليق
شارك على الشبكات الإجتماعية

Recommended Posts

  • 1

المشكلة لديك في نوع الترميز، استخدم utf8 بعد تطبيق soup 

لتستطيع بايثون طباعتها 

soup = BeautifulSoup(html).encode("utf-8")
أو
print(soup.encode("utf-8"))

يمكن تعديل نمط الترميز للمدخلات القياسية من خلال الشيفرة

sys.stdin.reconfigure(encoding='utf-8')
sys.stdout.reconfigure(encoding='utf-8')

ضعهم في أول الملف أو من خلال تغيير متغيرات البيئة بتنفيذ

  • set PYTHONIOENCODING=utf-8
  • set PYTHONLEGACYWINDOWSSTDIO=utf-8
رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...