اذهب إلى المحتوى

السؤال

Recommended Posts

  • 0
نشر

وعليكم السلام ورحمة الله وبركاته.

نعم، يمكنك ذلك . إذا كان العمود مثل  ID يحتوي على قيم فريدة ولا يوفر أي معلومات مفيدة للنموذج مثل أرقام تعريفية كما في ال ID ، فمن الأفضل إزالته من البيانات قبل تدريب النموذج. وذلك لأن هذه القيم قد تؤدي إلى overfitting حيث من الممكن أن النموذج سيحاول تعلم النمط الخاص بال ID وه لا معنى له . بدلا من التركيز على السمات المهمة.

لذلك يفضل إزالة العمود إذا كان :

  1.  يحتوي على قيم فريدة لكل عينة مثل الأرقام التعريفية كما في ال ID .
  2. لا يساهم في التنبؤ أو التحليل مثل إذا كان أسماء أو أرقام عشوائية.
  • 0
نشر

صحيح، فبطبيعته هو معرف فريد لكل صف في البيانات ومصمم لتمييز السجلات عن بعضها البعض في قاعدة البيانات، وليس لتقديم أي معلومة ذات معنى حول ما تحاول التنبؤ به باستخدام نموذج تعلم الآلة.

فالنموذج يبحث عن أنماط وعلاقات في الميزات للتنبؤ بالمتغير المستهدف، وعمود الـ ID لا يقدم أي نمط أو علاقة مفيدة.

لكن في حالات نادرة جداً يكون له معنى ضمني مرتبط بالبيانات، بمعنى لو الـ ID يتضمن تاريخاً أو تسلسلاً زمنياً، فتلك معلومات مفيدة، رغم أنه من الأفضل استخراج تلك المعلومة الزمنية في ميزة منفصلة بدلاً من استخدام الـ ID نفسه.

وللتأكيد، لو الـ ID مجرد رقم أو نص عشوائي لتعريف الصفوف، فإزالته هي القاعدة.

  • 0
نشر

نعم يمكنك حذف هذا العمود إذا كان مجرد معرف فريد لا يحتوي على أي معلومات مفيدة للنموذج، لأن وجوده قد يضيف ضوضاء غير ضرورية أثناء التدريب، أما إذا كان يتضمن بيانات قد تكون مفيدة في التنبؤ، فمن الأفضل تحليله قبل اتخاذ قرار بحذفه، و على الأغلب فهو مجرد ID فقط حيث أغلب البيانات تحتوي على هذا العمود، لذا من الأفضل حذفه.

  • 0
نشر

نعم إذا كان العمود يحتوي على قيم فريدة لكل عينة ولا يحمل أي معلومات مفيدة للنموذج، فيمكن حذفه من البيانات قبل تدريب النموذج. وذلك لأن هذه القيم الفريدة لا تساعد النموذج في التعلم أو التعميم، بل قد تؤدي إلى overfitting إذا تم استخدامها، قبل الحذف تأكد أن العمود لا يحتوي على معلومات مفيدة.

  • 0
نشر

بالتأكيد يمكنك ذلك فعمود ID يحتوي في الكثير من الأحيان على أرقام فريدة فقط خاصة بكل سطر، وبالتالي إبقاءه يمكن أن يؤثر بالسلب على تدريب النموذج، و أيضا بحذفه لن تخسر أي معلومة في البيانات بل يكون أفضل لتدريب النموذج، لهذا من الأفضل حذفه و تدريب النموذج بدونه

  • 0
نشر
بتاريخ 1 دقيقة مضت قال ياسر مسكين:

بالتأكيد يمكنك ذلك فعمود ID يحتوي في الكثير من الأحيان على أرقام فريدة فقط خاصة بكل سطر، وبالتالي إبقاءه يمكن أن يؤثر بالسلب على تدريب النموذج، و أيضا بحذفه لن تخسر أي معلومة في البيانات بل يكون أفضل لتدريب النموذج، لهذا من الأفضل حذفه و تدريب النموذج بدونه

الف شكراا جدا لحضرتك 

جزاك الله كل خير

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...