اذهب إلى المحتوى

إياد أحمد

الأعضاء
  • المساهمات

    92
  • تاريخ الانضمام

  • تاريخ آخر زيارة

كل منشورات العضو إياد أحمد

  1. أحاول الحصول على محتوى نص الوسم في صفحة html باستخدام سيلينيوم، لكن لم أستطع القيام بذلك؟
  2. أحاول تنزيل بعض الروابط تلقائياً من خلال selenium's click .. كيف يمكنني تحديد موقع التنزيل بحيث لا يتم تنزيله في مجلد التنزيلات الافتراضي؟
  3. أريد الحصول على كل الروابط الموجودة ضمن موقع ويب محدد، أي أريد الحصول على كل ال links ضمن الخاصية href لكل الوسوم <a> ؟ على سبيل المثال في الرابط هنا.
  4. عند البحث في الصفحات عن عنصر ما فقد لا يكون موجود وبالتالي سيتم رفع الاستثناء NoSuchElementException. ما أريده هو التقاط هذا الاستثناء لكي لا يتسبب بإيقاف البرنامج. وقد حاولت استخدام الكود التالي: el = driver.find_element_by_css_selector('.val') try: text = el.find_element_by_css_selector('#A').text + el.find_elements_by_css_selector('#B')[1].text except NoSuchElementException: text = el.find_element_by_css_selector('#C').text item.set_description(text) لكنه لم يتعرف على الاستثناء! و يعطيني خطأ: NameError: name 'NoSuchElementException' is not defined
  5. كيف يمكنني الحصول على أب العنصر input ثم أخيراً تحديد الخيار selected؟ <tr> <td> <select> <option value=0, selected='selected'> A </option> <option value=1, > B</option> <option value=2,> C</option> <option value=2,> D</option> </select> </td> <td> 'abcd' <input name='i1'> </input> <td> <tr>
  6. كيف يمكننا الحصول على attribute لعنصر ما، على سبيل المثال أريد الواصفة src هنا:
  7. كيف يمكنني الحصول على كود المصدر page_source لصفحة الويب باستخدام السيلينيوم؟ أريد أن أقوم بشيء مماثل لما يلي، لكن لا أعرف كيف أحصل على ال page_source : from selenium import webdriver br = webdriver.Firefox() br.get("url") if "something" in page_source : # Do something else: # Do something else
  8. أريد حفظ جميع ملفات تعريف الارتباط الحالية ضمن ملف لكي أعيد استخدامها لاحقاً، كيف يمكنني القيام بذلك؟
  9. أحاول استخدام سيلينيوم على متصفح كروم، لكنه يعطيني خطأ: WebDriver driver = new ChromeDriver(); """ Failed tests: setUp(com.TEST): The path to the driver executable must be set by the webdriver.chrome.driver system property; for more information, see code here. """ ما المشكلة؟
  10. كيف يمكننا استدعاء متصفح Firefox بدون رأس 'head'؟ قمت بتنفيذ الكود التالي، لكن لم ينجح الأمر: driver = webdriver.Firefox(firefox_binary=FirefoxBinary('firefox.exe', log_file=sys.stdout).add_command_line_options("--headless"))
  11. أقوم بالعديد من التنقلات في سيلينيوم لذا أريد طريقة لمعرفة عنوان url الحالي.
  12. أحتاج إلى تحديد عنصر من القائمة المنسدلة، مثلاً: <select id="A" class="select" name="B"> <option value="0">Choose your option:</option> <option value="1">ARG</option> <option value="2">BRA</option> <option value="3">GER</option> <option value="4">ITA</option> </select> أولا لا بد لي من النقر فوقه. أفعل هذا: driver.find_element_by_xpath("//select[id='B']").click() بعد ذلك لا بد لي من تحديد عنصر وليكن ARG. جربت استخدام inputElementFruits.send_keys(...) لكن لم ينجح.
  13. عندما أقوم بتشغيل الكود التالي: from selenium import webdriver driver = webdriver.Chrome() أتلقى هذا الخطأ: WebDriverException: Message: 'chromedriver' executable needs to be available in the path. Please look at http://docs.seleniumhq.org/download/#thirdPartyDrivers and read up at http://code.google.com/p/selenium/wiki/ChromeDriver علماً أنني قمت بتنزيل chromedriver لجهازي الذي يعمل بنظام windows من هنا. وبعد تحميل الملف المضغوط قمت بفك ضغطه ووضعه ضمن مجلد التنزيلات downloads، ثم قمت بوضع المسار إلى الملف الثنائي القابل للتنفيذ (C: \ Users \ michael \ Downloads \ chromedriver_win32) في "مسار" متغير البيئة. ما المشكلة؟
  14. كيف يمكنني العثور على عنصر يحتوي على نص معين، على سبيل في المقطع التالي: <!DOCTYPE html> <html> <body> <button type= “button” >Hsoub Mostql</button> </body> <html> أريد الحصول على العنصر button الذي يحوي النص Hsoub Mostql.
  15. هل من الممكن التقاط لقطة شاشة باستخدام Selenium WebDriver ( ليس من خلال Selenium Remote Control)؟
  16. كيف يمكننا الوصول إلى كود عنصر ويب ما element source؟ أعلم أنه يمكنني الحصول على عنصر ويب بالشكل التالي: element=webdriverObj.find_element_by_css_selector('#id') # وأنا أعلم أنه يمكنني الحصول على مصدر الصفحة الكامل باستخدام: webdriverObj.page_source # لكن ماذا عن عنصر ويب محدد.. أي هل يوجد شيئ كهذا: element.source # له Html بحيث يعيد كود
  17. أريد البدء في استخدام مكتبة Selenium لتنفيذ عمليات استخراج البيانات، لذا أرغب في تثبيتها، ماهي العمليات التي يجب أن أقوم بها؟
  18. كيف يمكننا إضافة خاصية لوسم محدد. على سبيل المثال في كود Html التالي: <option value="C"> Syria</option> أريد إضافة الخاصية selected: <option selected="" value="C"> Syria</option>
  19. أقوم باستخراج بعض البيانات من إحدى صفحات الويب، وقد قمت بتحليل إحدى أكواد ال HTML بالشكل التالي: spage = bs(urlopen(URL)) b = spage.body.find('div', 'class'='badges') print(b) # حصلت على الخرج التالي: """ <span> <span title="9 gold badges"><span class="badge1"></span> <span class="badgecount">9</span></span> <span title="38 silver badges"><span class="badge2"></span> <span class="badgecount">38</span></span><span title="56 bronze badges"><span class="badge3"></span> <span class="badgecount">56</span></span></span> """ الآن أريد استخراج 56 bronze badges و 9 gold badges و 38 silver badges منها؟
  20. كتبت الكود التالي للحصول على البيانات من جدول ب ID محدد: from bs4 import BeautifulSoup hDoc = br.response() soup = BeautifulSoup(hDoc.read(),'html') table = soup.find(lambda tag: tag.name=='table' and tag.has_key('id') and tag['id']=="HistoryData1") rows = table.findAll(lambda tag: tag.name=='tr') وهذا هو المقطع من كود HTML: <table cellspacing="0" cellpadding="3" border="0" id="HistoryData1" style="width:100%;border-collapse:collapse;"> <tr class="gridHeader" valign="top"> <td class="titleGridRegNoB" align="center" valign="top"><span dir=RTL>ballov</span></td> <td class="titleGridReg" align="center" valign="top">Grand</td> <td class="titleGridReg" align="center" valign="top">andera</td> <td class="titleGridReg" align="center" valign="top">colofisiaky</td> <td class="titleGridReg" align="center" valign="top">tochy</td><td class="titleGridReg" align="center" valign="top"><span dir="rtl"> (laesd)</span></td> <td class="titleGridReg" align="center" valign="top">שער נעילה מתואם</td><td class="titleGridReg" align="center" valign="top">kagt</td> </tr> <tr onmouseover="this.style.backgroundColor='#FDF1D7'" onmouseout="this.style.backgroundColor='#ffffff'"> لكن عندما أحاول طباعة الجدول أحصل على None؟ print (table) # None
  21. في المستند التالي: <select> <option value="0">1999/9/5</option> <option value="1">2010/9/5</option> <option value="2">2017/9/5</option> <option value="3" selected>220/9/5</option> </select> أريد الحصول على ال option المُختارة فقط (selected). استخدمت الدالة findall لكنها تعيد كل الخيارات؟ .findAll('option',attrs={'selected':''})
  22. أحاول تحويل مستند Html إلى نص، على سبيل الكود التالي: <div class="A"> <p><strong></strong>Text is available under the Creative Commons Attribution-ShareAlike License </p> <p>Consectetuer adipiscing elit. <a href="http://wiki.com/" target="_blank" class="K">Some Link</a> Aenean commodo ligula eget dolor. Aenean massa</p> <p>Aenean massa.Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p> </div>
  23. لدي موقع الويب التالي: https://en.wikipedia.org/wiki/Nike,_Inc وأريد تحليل جزء محدد منه على سبيل المثال أريد فقط العناصر التي لها الكلاس mw-headline لذا كيف يمكننا القيام بذلك؟
  24. أقوم باستخراج بعض البيانات من الموقع الموضح أدناه، لذا أحاول استعراض محتويات HTML التي قام بقراءتها bs4، لكي أكون قادراً على تحديد ما يجب القيام به، لكن عند طباعة كائن bs4 تظهر محتويات الHTML بطريقة فوضوية وصعبة القراءة، فما هو حل هذه المشكلة؟ Web_url ="https://de.wikipedia.org/wiki/Lionel_Messi" r = requests.get(Web_url) soup = BeautifulSoup(r.content, 'html.parser') print(soup)
  25. أريد الحصول على جميع وسوم ال <script> في مستند ثم معالجة كل واحدة بناءً على وجود أو عدم وجود سمات (attributes) معينة. على سبيل المثال إذا كانت السمة bar موجودة ضمن الوسم script أريد أن يتم تنفيذ شيء محدد وهكذا.. كيف يمكن أن أقوم بمثل هذا الأمر؟
×
×
  • أضف...