اذهب إلى المحتوى

السؤال

نشر (معدل)

كشخص مهتم بتعلم الالة والدكاء الاصطناعي التوليدي, هل استطيع الاستغناء عن مسار تحليل البيانات ؟

تم التعديل في بواسطة انس القحطاني2

Recommended Posts

  • 0
نشر

لا يفضل أبداً بالاستغناء عن مسار تحليل البيانات فمسار تحليل البيانات في الدورة ليس تخصص منفصل، بل هو أساس يبنى عليه كل ما يأتي بعده.

وذلك لأن نماذج تعلم الآلة ببساطة لا تفهم البيانات الخام كما هي. الذكاء الاصطناعي يحتاج إلى بيانات نظيفة، منظمة، ومهيكلة. ومسار تحليل البيانات يعلمك كيف تقوم بتجهيز هذه البيانات .

  • 0
نشر

تحليل البيانات أساس مجال تعلم الآلة، فالذكاء الاصطناعي وتعلم الآلة في الأساس عبارة عن إحصاء متقدم، والنماذج التوليدية مثل ChatGPT أو نماذج توليد الصور تعتمد بالكامل على الاحتمالات والتوزيعات الإحصائية، وبدون أساس إحصائي، لن تفهم كيف تقيس أداء النموذج ولن تعرف كيف تختار الخوارزمية المناسبة لبياناتك.

وهناك قاعدة ثابتة في المجال وهي بيانات سيئة تعني نماذج سيئة Garbage In, Garbage Out، وستقضي حوالي 70% إلى 80% من وقتك في تحليل البيانات وتنظيفها Data Preprocessing & EDA قبل أن تبدأ في بناء أو تدريب أي نموذج ذكاء اصطناعي.

وبدون تلك المهارة ستعرف كيف تستخدم أكواد جاهزة لتدريب النماذج، لكن لن تستطيع معرفة لماذا تفشل النماذج عندما تكون الدقة منخفضة لأن المشكلة في الأغلب تكون في البيانات وليس في الكود.

وعند بناء تطبيقات الذكاء الاصطناعي التوليدي المتقدمة مثل RAG، ستواجه صعوبة كبيرة في معالجة وتنظيف قواعد البيانات النصية قبل ربطها بالنموذج اللغوي.

  • 0
نشر

وعليكم السلام ورحمة الله تعالى وبركاته،

تحليل البيانات ليس مسارا منفصلا عن تعلم الالة بل هو الركيزة التي يقوم عليها فهم النماذج وتقييمها، فبدون معرفة كيفية استكشاف البيانات وتنظيفها باستخدام أدوات مثل Pandas و NumPy، ستجد نفسك عاجزا عن تفسير سلوك النموذج حين تنخفض دقته.

فالنماذج التوليدية بالذات سواء كانت نماذج لغوية كبيرة أو نماذج توليد الصور تعتمد اعتمادا كليا على جودة البيانات التي تغذيها، وهذا ما يعبر عنه المختصون بمبدأ "Garbage In, Garbage Out".

وما يميز المهندس الذي يفهم المجال عن من يكتفي بتشغيل اكواد جاهزة هو قدرته على تشخيص المشكلة في البيانات قبل أن يبحث عنها في الكود، وهذه القدرة لا تأتي إلا من الأساس التحليلي لذا فان الاستغناء عن هذا المسار سيجعل مسيرتك التعليمية مبنية على أساس هش بغض النظر عن مستوى الأدوات التي ستستخدمها.

  • 0
نشر

إن مسار تحليل البيانات مهم جدا لمعرفة كيفية التعامل مع البيانات وتنظيفها وأيضا كيفية إستخراجها وستحتاج تلك الأمور عند إنشاء النماذج أو التعامل مع البيانات من مصادر خارجية ولذلك فهو مهم وليس فقط لمجال تحليل البيانات .

لذلك يفضل عدم الإستغناء عن هذا المسار ومشاهدته حتى تحقق أقصى إستفادة من الدورة.

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...