عرض محتويات صفحة الويب HTML بطريقة واضحة باستخدام BeautifulSoup في بايثون

إياد أحمد · 27 نوفمبر 2021

أقوم باستخراج بعض البيانات من الموقع الموضح أدناه، لذا أحاول استعراض محتويات HTML التي قام بقراءتها bs4، لكي أكون قادراً على تحديد ما يجب القيام به، لكن عند طباعة كائن bs4 تظهر محتويات الHTML بطريقة فوضوية وصعبة القراءة، فما هو حل هذه المشكلة؟

Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
r = requests.get(Web_url)
soup = BeautifulSoup(r.content, 'html.parser')
print(soup)

Ali Haidar Ahmad · 27 نوفمبر 2021

نستخدم ما يسمى ال Pretty-Printing أي الطباعة المُجملة، من خلال الدالة prettify، التي تقوم بطباعة الصفحة كما هي، كالتالي:

# استيراد الوحدات اللازمة
from bs4 import BeautifulSoup
import requests
#  تحديد العنوان الهدف
Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
# GET ارسال طلب 
request = requests.get(Web_url)
# استخراج المحتويات
htmldata=request.text
# BeautifulSoup تحليل الملف الذي تم الحصول عليه من خلال 
soup = BeautifulSoup(htmldata, 'html.parser')
# طباعتها 
print(soup.prettify())

الخرج سيكون بالشكل التالي:

<!DOCTYPE html>
<html class="client-nojs" dir="ltr" lang="de">
 <head>
  <meta charset="utf-8"/>
  <title>
   Lionel Messi – Wikipedia
  </title>
..
..
..
..

تم التعديل في 27 نوفمبر 2021 بواسطة Ali Haidar Ahmad

عرض محتويات صفحة الويب HTML بطريقة واضحة باستخدام BeautifulSoup في بايثون

السؤال

إياد أحمد

1 جواب على هذا السؤال

Recommended Posts

Ali Haidar Ahmad

انضم إلى النقاش

إعلانات

تابعنا على

الرئيسية

كيف أتعلم؟

تابعنا

دروس ومقالات

أسئلة وأجوبة

كتب

دورات

بطاقات هدية