أسامة عرب نشر 6 ديسمبر 2015 أرسل تقرير نشر 6 ديسمبر 2015 كنتُ أشاهد محاضرة مكثّفة عن تقنيات التدوين الرقمي، وذكر المحاضر مصطلح تجريف البيانات Scraping data أثناء تعاملنا مع ملفات الـ PDFفما هو المقصود بهذا المصطلح؟ اقتباس
0 حنين نشر 9 ديسمبر 2015 أرسل تقرير نشر 9 ديسمبر 2015 تجريف البيانات يعني ببساطة حصولك على البيانات والمعلومات المطلوبة بشكل أكثر سهولة من مختلف الوسائط، ومنها صفحات الوِب وملفات الـ pdf وغيرها من الوسائط.على سبيل المثال يُتيح لك برنامج Tabula الحصول على الجداول المُضمّنة في ملفات الـ pdf بأسلوب سهل وسريع للغاية (في نسخته الحالية لا يدعم اللغة العربية).مثال آخر، يمكنك استيراد أي جدول موجود في أي صفحة على الوِب باستخدام تطبيق جداول البيانات الخاص بغوغل عن طريق المعادلة التالية:=IMPORTHTML(“URL”,“table”,1)استبدل url برابط الصفحة، المُتغيّر الثاني يُحدّد العنصر الذي ترغب باستيراده وهو في حالتنا هذه جدول (يلزمك بعض المعرفة بلغة html لمعرفة أسماء العناصر)، أما المُتغيّر الأخيرة فهو ترتيب العنصر ضمن الصفحة، وفي حالتنا هذه سوف نستورد الجدول الأول من الصفحة. اضغط على Enter وسيتم جلب الجدول المطلوب.هذه مُقدّمة بسيطة جدًا عن تجريف البيانات والذي يُعتبر من الأدوات اللازمة اليوم للصحفيين والمُدونيين. 1 اقتباس
السؤال
أسامة عرب
كنتُ أشاهد محاضرة مكثّفة عن تقنيات التدوين الرقمي، وذكر المحاضر مصطلح تجريف البيانات Scraping data أثناء تعاملنا مع ملفات الـ PDF
فما هو المقصود بهذا المصطلح؟
1 جواب على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.