Ali Ahmed55 نشر 11 مايو أرسل تقرير نشر 11 مايو السلام عليكم هو عمود الاسم مهم في تحليل البيانات او بناء النموذج ؟ 2 اقتباس
0 Mustafa Suleiman نشر 11 مايو أرسل تقرير نشر 11 مايو مهم في تحليل البيانات من أجل فهمها بشكل صحيح، الاستكشاف، التحقق، والربط، لأنه المعرف الأساسي للسجلات ويساعد على تمييز وفهم كل صف من البيانات على حدة، مثلاً، عند تحليل بيانات العملاء، اسم العميل هو ما يميز عميلاً عن آخر. أما لبناء النموذج فيُستبعد من مجموعة الميزات المستخدمة لتدريب النموذج، إلا إن تم تحويله إلى ميزات أخرى ذات معنى من الأسماء كالجنس من اللقب، أو نوع الشركة من اسمها، فتلك الميزات الجديدة هي التي تُستخدم في النموذج، وليس الاسم الأصلي. أما بعد بناء النموذج والحصول على التنبؤات، يُستخدم لربط التنبؤات بالسجلات الأصلية وفهم لمن أو لأي شيء تنطبق تلك التنبؤات. 1 اقتباس
0 محمد_عاطف نشر 11 مايو أرسل تقرير نشر 11 مايو وعليكم السلام ورحمة الله وبركاته. في تحليل البيانات وبناء النماذج إن عمود الاسم أو المعرف الفريد مثل ID عادة ليس مهم من الناحية الإحصائية أو التنبؤية بل يستخدم فقط للتعريف بالبيانات أو لتنظيميها. فإذا كان مجرد معرف فريد مثل ID ولا يحمل أي معلومات مفيدة للنموذج فهنا يجب استبعاده قبل التدريب لأنه قد يتسبب في overfitting وذلك خصوصا إذا اعتقد النموذج أن قيمته مؤثرة في النتيجة. مثال في نموذج التنبؤ بالمرضي فلو هناك عمود لإسم المريض فهو بالفعل لا يؤثر على النتيجة. أما إذا كان الاسم أو المعرف يحتوي على معلومات مهمة مثل أن الإسم قد يحمل الاسم دلالة على الجنسية و الجنس فمثلا يمكننا إكتشاف الأسماء التي تستخدم للذكور و للإناث وأيضا التي تدل على دولة وجنسية هذا الشخص أو عرقه وفي تلك الحالة يمكنك بالفعل استخراج السمات منه . وأيضا قد يكون مهما في الأمور مثل تتبع البيانات وربط التنبؤات بالسجلات الأصلية ومثلا يمكنك استبعاد عملاء معينين بناء على الأسماء. وأيضا من الممكن أن تستخدمه في معالجة اللغة الطبيعية مثل تطبيقات تحليل المشاعر والتي تعتمد على الشخص والسياق. 1 اقتباس
السؤال
Ali Ahmed55
السلام عليكم
هو عمود الاسم مهم في تحليل البيانات او بناء النموذج ؟
3 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.