اذهب إلى المحتوى
  • 0

عرض محتويات صفحة الويب HTML بطريقة واضحة باستخدام BeautifulSoup في بايثون

إياد أحمد

السؤال

أقوم باستخراج بعض البيانات من الموقع الموضح أدناه، لذا أحاول استعراض محتويات HTML التي قام بقراءتها bs4، لكي أكون قادراً على تحديد ما يجب القيام به، لكن عند طباعة كائن bs4 تظهر محتويات الHTML بطريقة فوضوية وصعبة القراءة، فما هو حل هذه المشكلة؟

Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
r = requests.get(Web_url)
soup = BeautifulSoup(r.content, 'html.parser')
print(soup)

 

رابط هذا التعليق
شارك على الشبكات الإجتماعية

Recommended Posts

  • 0

نستخدم ما يسمى ال Pretty-Printing أي الطباعة المُجملة، من خلال الدالة prettify، التي تقوم بطباعة الصفحة كما هي، كالتالي:

# استيراد الوحدات اللازمة
from bs4 import BeautifulSoup
import requests
#  تحديد العنوان الهدف
Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi"
# GET ارسال طلب 
request = requests.get(Web_url)
# استخراج المحتويات
htmldata=request.text
# BeautifulSoup تحليل الملف الذي تم الحصول عليه من خلال 
soup = BeautifulSoup(htmldata, 'html.parser')
# طباعتها 
print(soup.prettify())

الخرج سيكون بالشكل التالي:

<!DOCTYPE html>
<html class="client-nojs" dir="ltr" lang="de">
 <head>
  <meta charset="utf-8"/>
  <title>
   Lionel Messi – Wikipedia
  </title>
..
..
..
..

 

تم التعديل في بواسطة Ali Haidar Ahmad
رابط هذا التعليق
شارك على الشبكات الإجتماعية

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...