اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

يمكنك القيام بضلك من خلال الحصول على الصفحة المطلوبة من خلال تنفيذ طلب get. ثم استخراج محتوى الصفحة، ثم تحليلها من خلال مكتبة bs4 وإجراء ماتحتاجه من تعديلات، ثم لحفظها نقوم بحفظ كائن soup في ملف من خلال تعيين الترميز على UTF-8. وسنستخدم الدالة prettify التي تجعل محتوى الصفحة أكثر سهولة للقراءة. ثم نقوم بتحويل كائن soup إلى سلسلة ونخزنه ضمن الملف بصيغة html. كما في الكود التالي:

# استيراد المكتبات
from bs4 import BeautifulSoup
import requests
# تحديد العنوان الهدف
URL = 'link'
# تنفيذ طلب الحصول على الصفحة
page = requests.get(URL)
# استحراج محتوى الصفحة  
text = page.content
# BeautifulSoup تحليل النص الذي تم الحصول عليه من خلال
soup = BeautifulSoup(text, "html.parser")
# w فتح ملف مع تحديد وضع الكتابة
# UTF-8 ضبط الترميز على 
with open("output.html", "w", encoding = 'utf-8') as file:
    # لتجميل المحتوى prettify سنقوم باستخدام الدالة 
	# بعد ذلك نحولها إلى سلسلة ونكتبها في الملف
    file.write(str(soup.prettify()))

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...