اذهب إلى المحتوى

السؤال

نشر

السلام عليكم

هو معني ان بنزل بيانات سواء من كاجل او غيره ونحليلها هل معني كده ان بحليل البيانات في الوقت الحقيقي ؟

هو احنا نقدر ان نحليل البيانات في الوقت الحقيقي ؟

 

Recommended Posts

  • 0
نشر

لا لا يمكن تعبير تحليل البيانات بعد تنزيلها من كاجل أو غيره تحليلا في الوقت الحقيقي لكن يمكن تحليل البيانات في الوقت الحقيقي باستخدام تقنيات وأدوات متقدمة مثل Apache Kafka وApache Flink وغيرها.

لأنك عندما تقوم بتنزيل البيانات من منصات مثل كاجل وتحليلها، فأنت تعمل مع بيانات ثابتة أو تاريخية هذا يعني أنك تجري التحليل بعد جمع البيانات وتخزينها، وليس أثناء تدفق البيانات أما تحليل البيانات في الوقت الحقيقي أي فور وصولها أو إنشائها، مما يتيح اتخاذ قرارات فورية من التقنيات المستخدمة:

  • Apache Kafka: وهي منصة لمعالجة تدفق البيانات.
  • Apache Flink: وهو إطار عمل لمعالجة البيانات في الوقت الحقيقي.
  • Spark Streaming: جزء من Apache Spark لمعالجة تدفق البيانات.
  • 0
نشر

تحليل البيانات من خلال تنزيلها من  كاجل أو غيرها لا يعني أنك تقوم بتحليل البيانات في الوقت الحقيقي، فتحليل البيانات من ملفات ثابتة مثل ملفات CSV أو JSON يعتبر تحليل بيانات غير تفاعلي أو غير لحظي، بمعنى أن البيانات تكون قد جمعت مسبقا، ويتم تحليلها بعد ذلك.

أما التحليل في الوقت الحقيقي  يعني أنك تقوم بتحليل البيانات فور تدفقها، بحيث تحصل على المعلومات أو النتائج بشكل فوري أو شبه فوري بناء على بيانات حية، و يمكنك إجراء تحليل في الوقت الحقيقي إذا كان لديك وصول إلى البيانات الحية التي تتدفق مباشرة من المصادر، مثل تدفقات البيانات من أجهزة الاستشعار، أو أنظمة المعاملات.

  • 0
نشر

تلك ليست بيانات خاصة بالوقت الحقيقي، بل هي بيانات تم تجميعها وإعدادها مسبقًا.

تحليل البيانات في الوقت الحقيقي يعني معالجة البيانات وتحليلها فور وصولها، دون أي تأخير، أي يجب أن يكون لديك مصدر بيانات يوفر بيانات جديدة بشكل مستمر، والأمر بحاجة إلى بنية تحتية قوية قادرة على معالجة البيانات بسرعة كبيرة.

فمثلاً لتحليل بيانات تطبيق التواصل الاجتماعي في الوقت الفعلي ستقوم باستخدام تقنيات البث Streaming مثل Apache Kafka أو Apache Flume لجمع البيانات من مصادر متعددة في الوقت الفعلي.

ثم معالجة البيانات من خلال Apache Storm أو Google Cloud Dataflow أو AWS Lambda.

ثم تحليل البيانات في الوقت الفعلي من خلال Apache Druid أو Amazon Redshift أو Google BigQuery أو Tableau.

وللحصول على معلومات أعمق عن البيانات ستحتاج إلى استخدام الـ Machine Learning.

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...