اذهب إلى المحتوى

إياد أحمد

الأعضاء
  • المساهمات

    92
  • تاريخ الانضمام

  • تاريخ آخر زيارة

كل منشورات العضو إياد أحمد

  1. أرغب في الحصول على كافة وسوم <a> التابعة لـ <li>: <div> <li class="c"> <a>linkA</a> <ul> <li> <a>linkB</a> </li> </ul> </li> </div> كيف يمكننا القيام بذلك؟
  2. أحاول استخراج بعض البيانات من إحدى صفحات الويب، لكن يظهر لي خطأ: from bs4 import BeautifulSoup import urllib.request url="'https://en.wikipedia.org/wiki/NIFTY_50'" req = urllib.request.urlopen(url) soup = BeautifulSoup(req.read(), 'html.parser') print(soup) الخطأ: UnicodeEncodeError: 'charmap' codec can't encode characters in position 70924-70950: character maps to <undefined>
  3. لدي الموقع التالي: https://de.wikipedia.org/wiki/Lionel_Messi وأحتاج إلى استخراج الصور منه "src"، لذا كيف يمكننا القيام بذلك؟
  4. كيفية حذف عنصر ابن child (عنصر فرعي) ضمن ملف، على سبيل المثال في الملف التالي: """ <!DOCTYPE> <html> <head><title>html</title></head> <body> <div id="x"> <p> This is child of div with id = "x". <span>Child of "P"</span> </p> <div> Another Child of div with id = "x". </div> </div> <p> aaadas </p> </body> </html> """
  5. أريد القيام ببعض العمليات على محتوى إحدى الصفحات وبعد ذلك حفظ ملف ال HTML بعد التعديل على جهازي بصيغة html... لذا فسؤالي هو كيف نقوم بحفظ ملف ال html بعد تعديله؟
  6. لدي ملف XML وأحتاج إلى تحويله إلى DataFrame لإجراء بعض العمليات عليه، فكيف يمكننا القيام بذلك؟ هذه هي محتويات الملف: <?xml version="1.0"?> <catalog> <book id="bk101"> <author>Gambardella, Matthew</author> <title>XML Developer's Guide</title> <genre>Computer</genre> <price>44.95</price> <publish_date>2000-10-01</publish_date> <description>An in-depth look at creating applications with XML.</description> </book> <book id="bk102"> <author>Ralls, Kim</author> <title>Midnight Rain</title> <genre>Fantasy</genre> <price>5.95</price> <publish_date>2000-12-16</publish_date> <description>A former architect battles corporate zombies, an evil sorceress, and her own childhood to become queen of the world.</description> </book> <book id="bk103"> <author>Corets, Eva</author> <title>Maeve Ascendant</title> <genre>Fantasy</genre> <price>5.95</price> <publish_date>2000-11-17</publish_date> <description>After the collapse of a nanotechnology society in England, the young survivors lay the foundation for a new society.</description> </book> <book id="bk104"> <author>Corets, Eva</author> <title>Oberon's Legacy</title> <genre>Fantasy</genre> <price>5.95</price> <publish_date>2001-03-10</publish_date> <description>In post-apocalypse England, the mysterious agent known only as Oberon helps to create a new life for the inhabitants of London. Sequel to Maeve Ascendant.</description> </book> <book id="bk105"> <author>Corets, Eva</author> <title>The Sundered Grail</title> <genre>Fantasy</genre> <price>5.95</price> <publish_date>2001-09-10</publish_date> <description>The two daughters of Maeve, half-sisters, battle one another for control of England. Sequel to Oberon's Legacy.</description> </book> <book id="bk106"> <author>Randall, Cynthia</author> <title>Lover Birds</title> <genre>Romance</genre> <price>4.95</price> <publish_date>2000-09-02</publish_date> <description>When Carla meets Paul at an ornithology conference, tempers fly as feathers get ruffled.</description> </book> <book id="bk107"> <author>Thurman, Paula</author> <title>Splish Splash</title> <genre>Romance</genre> <price>4.95</price> <publish_date>2000-11-02</publish_date> <description>A deep sea diver finds true love twenty thousand leagues beneath the sea.</description> </book> <book id="bk108"> <author>Knorr, Stefan</author> <title>Creepy Crawlies</title> <genre>Horror</genre> <price>4.95</price> <publish_date>2000-12-06</publish_date> <description>An anthology of horror stories about roaches,centipedes, scorpions and other insects.</description> </book> <book id="bk109"> <author>Kress, Peter</author> <title>Paradox Lost</title> <genre>Science Fiction</genre> <price>6.95</price> <publish_date>2000-11-02</publish_date> <description>After an inadvertant trip through a Heisenberg Uncertainty Device, James Salway discovers the problems of being quantum.</description> </book> <book id="bk110"> <author>O'Brien, Tim</author> <title>Microsoft .NET: The Programming Bible</title> <genre>Computer</genre> <price>36.95</price> <publish_date>2000-12-09</publish_date> <description>Microsoft's .NET initiative is explored in detail in this deep programmer's reference.</description> </book> <book id="bk111"> <author>O'Brien, Tim</author> <title>MSXML3: A Comprehensive Guide</title> <genre>Computer</genre> <price>36.95</price> <publish_date>2000-12-01</publish_date> <description>The Microsoft MSXML3 parser is covered in detail, with attention to XML DOM interfaces, XSLT processing, SAX and more.</description> </book> <book id="bk112"> <author>Galos, Mike</author> <title>Visual Studio 7: A Comprehensive Guide</title> <genre>Computer</genre> <price>49.95</price> <publish_date>2001-04-16</publish_date> <description>Microsoft Visual Studio 7 is explored in depth,looking at how Visual Basic, Visual C++, C#, and ASP+ are integrated into a comprehensivedevelopment environment.</description> </book> </catalog>
  7. كيف يمكننا القيام بتغليف عنصر ما، بوسم آخر، ففرضاً لدي المستند التالي: <p> sometexthere </p> وأريد أن يتم تغليفه بالوسمين <i> و <div>: <div><p><i> sometexthere </i></p></div> كيف نقوم بذلك؟
  8. أثناء استخلاص بعض البيانات من مواقع الويب، يكون هناك بعض الوسوم الفارغة، على سبيل المثال كما في المستند التالي: <p> <p></p> <strong>some<br>text<br>here</strong></p> لذا كيف يمكنني معالجة هكذا حالات؟ أو بمعنى آخر كيف يمكننا حذف هذه الوسوم؟
  9. كيف يمكنني الحصول على جميع الأصناف classes الموجودة في الرابط التالي: https://en.wikipedia.org/wiki/2019_Ballon_d'Or
  10. أحاول استخراج الجدول الموجود في الرابط التالي باستخدام bs4، كيف يمكنني القيام بذلك؟https://en.wikipedia.org/wiki/2019_Ballon_d'Or
  11. كيف يمكننا القيام بتحميل ملفات ال PDF من صفحات الويب من خلال مكتبة BeautifulSoup؟
  12. أحاول جمع بعض المعلومات من المواقع المختلفة وأريد استخدام bs4 لاستخلاص بعض الفقرات من مواقع مختلفة، فيكف يمكنني القيام بذلك؟ على سبيل المثال لدي صفحة الويب التالية: https://undergrad.cs.umd.edu/what-computer-science أريد أن أقوم بسحب هذه الفقرة.
  13. لدي الموقع التالي: https://www.imdb.com/title/tt5648202/ وأحاول استخراج القيم التي تأخذها ال attribute (السمة) class ضمن الوسم main في الصفحة؟ كيف يمكنني الحصول عليها؟
  14. كيف يمكننا البحث عن نص معين داخل tag معين. على سبيل المثال البحث عن أي نص يحوي كلمة دورة ضمن الوسم h وإرجاع هذا ال tag؟
  15. لدي مستند HTML ، واحتاج إلى العثور على tags واستخراجها من المستند باستخدام فئة CSS؟ على سبيل المثال المستند التالي: HTML Document: <html> <head> <title> Hsoub Academy </title> </head> <body> <div class="ext" >Extract this tag</div> </body> </html> كيف نقوم بذلك؟
  16. كيف يمكننا القيام باستخراج عنوان الصفحة وجميع عناوين الويب URLs الموجودة ضمن صفحة معينة من خلال مكتبة BeautifulSoup في بايثون؟
  17. أحتاج إلى تثبيت مكتبة beautifulsoup4 ؟
×
×
  • أضف...