اذهب إلى المحتوى

السؤال

نشر

أقوم باستخراج بعض البيانات من الموقع الموضح أدناه، لذا أحاول استعراض محتويات HTML التي قام بقراءتها bs4، لكي أكون قادراً على تحديد ما يجب القيام به، لكن عند طباعة كائن bs4 تظهر محتويات الHTML بطريقة فوضوية وصعبة القراءة، فما هو حل هذه المشكلة؟

Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
r = requests.get(Web_url)
soup = BeautifulSoup(r.content, 'html.parser')
print(soup)

 

Recommended Posts

  • 0
نشر (معدل)

نستخدم ما يسمى ال Pretty-Printing أي الطباعة المُجملة، من خلال الدالة prettify، التي تقوم بطباعة الصفحة كما هي، كالتالي:

# استيراد الوحدات اللازمة
from bs4 import BeautifulSoup
import requests
#  تحديد العنوان الهدف
Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
# GET ارسال طلب 
request = requests.get(Web_url)
# استخراج المحتويات
htmldata=request.text
# BeautifulSoup تحليل الملف الذي تم الحصول عليه من خلال 
soup = BeautifulSoup(htmldata, 'html.parser')
# طباعتها 
print(soup.prettify())

الخرج سيكون بالشكل التالي:

<!DOCTYPE html>
<html class="client-nojs" dir="ltr" lang="de">
 <head>
  <meta charset="utf-8"/>
  <title>
   Lionel Messi – Wikipedia
  </title>
..
..
..
..

 

تم التعديل في بواسطة Ali Haidar Ahmad

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...