• 0

ما هو المقصود بتجريف البيانات Scraping data؟

كنتُ أشاهد محاضرة مكثّفة عن تقنيات التدوين الرقمي، وذكر المحاضر مصطلح تجريف البيانات Scraping data أثناء تعاملنا مع ملفات الـ PDF

فما هو المقصود بهذا المصطلح؟

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 0

تجريف البيانات يعني ببساطة حصولك على البيانات والمعلومات المطلوبة بشكل أكثر سهولة من مختلف الوسائط، ومنها صفحات الوِب وملفات الـ pdf وغيرها من الوسائط.

على سبيل المثال يُتيح لك برنامج Tabula الحصول على الجداول المُضمّنة في ملفات الـ pdf بأسلوب سهل وسريع للغاية (في نسخته الحالية لا يدعم اللغة العربية).

مثال آخر، يمكنك استيراد أي جدول موجود في أي صفحة على الوِب باستخدام تطبيق جداول البيانات الخاص بغوغل عن طريق المعادلة التالية:

=IMPORTHTML(“URL”,“table”,1)

استبدل url برابط الصفحة، المُتغيّر الثاني يُحدّد العنصر الذي ترغب باستيراده وهو في حالتنا هذه جدول (يلزمك بعض المعرفة بلغة html لمعرفة أسماء العناصر)، أما المُتغيّر الأخيرة فهو ترتيب العنصر ضمن الصفحة، وفي حالتنا هذه سوف نستورد الجدول الأول من الصفحة. اضغط على Enter وسيتم جلب الجدول المطلوب.

هذه مُقدّمة بسيطة جدًا عن تجريف البيانات والذي يُعتبر من الأدوات اللازمة اليوم للصحفيين والمُدونيين.

1 شخص أعجب بهذا

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة

يجب أن تكون عضوًا لدينا لتتمكّن من التعليق

انشاء حساب جديد

يستغرق التسجيل بضع ثوان فقط


سجّل حسابًا جديدًا

تسجيل الدخول

تملك حسابا مسجّلا بالفعل؟


سجّل دخولك الآن