لوحة المتصدرين
المحتوى الأكثر حصولًا على سمعة جيدة
المحتوى الأعلى تقييمًا في 12/15/24 في كل الموقع
-
السلام عليكم هو فيه فرق مابين ال object و بين الStr في باثيون ؟ عشان ان فيه الكود ده عاوز بس العمود ان يكون نوع Str هو بس اليتغير ؟ encoder = LabelEncoder() for columns in data_train.columns: if data_train[columns].dtypes == object: data_train[columns] = encoder.fit_transform(data_train[columns]) فا اي الفرق مايبن كده وكده encoder = LabelEncoder() for columns in data_train.columns: if data_train[columns].dtypes == str: data_train[columns] = encoder.fit_transform(data_train[columns])3 نقاط
-
السلام عليكم هو اي اهميه الconfidence intervals في تحليل البيانات ؟2 نقاط
-
السلام عليكم هو اي الفرق مابين OneHotEncoder, LabelEncoder ؟2 نقاط
-
السلام عليكم اريد برمجة تطبيق لادارة مؤسسىة بحيث يستخدمه من 50 الى 100 مستخدم في ان واحد و يعمل على شبكة محلية فقط و لا يتصل بالانترنت اريد البرمجة بتقنيات الويب و ليس سطح المكتب بلغة بايثون و django فكيف يتم نحويل كمبيوتر pc الى استضافة مواقع django يستخدمه من 50 الى 100 مستخدم في ان واحد وماهي متطلبات هدا الجهاز2 نقاط
-
المفهوم الأساسي بسيط، الفكرة الأساسية هي أننا نستخدم بيانات العينة لتقدير قيمة غير معروفة في المجتمع (مثل متوسط الدخل في بلد ما)، ومجال الثقة يعطينا نطاقًا من القيم المحتملة لتلك القيمة غير المعروفة، مع مستوى معين من الثقة. وفي معظم الحالات، لا تحتاج إلى فهم عميق للرياضيات الكامنة وراء حساب الفترات الثقة، أي تستطيع استخدام الأدوات الإحصائية (مثل برامج الإحصاء أو لغات البرمجة) لحسابها وتفسيرها.1 نقطة
-
LabelEncoder يقوم بتحويل القيم الفئوية (مثل أحمر، أخضر، أزرق) إلى قيم رقمية صحيحة (مثل 0، 1، 2)، أي يعين رقمًا فريدًا لكل فئة حسب ترتيب ظهورها في البيانات أو ترتيب أبجدي. ونستخدمه مع البيانات Ordinal Categorical Data، أي البيانات التي تحمل ترتيبًا أو تسلسلًا منطقيًا (مثل منخفض، متوسط، مرتفع). أيضًا مع البيانات الفئوية الاسمية Nominal Categorical Data مثل الألوان، ولكن بحذر شديد، لأن ذلك أحيانًأ يؤدي إلى مشاكل في بعض الخوارزميات مثل إدخال ترتيب غير مرغوب حيث الأرقام التي يعينها قد تفهمها الخوارزمية على أنها ترتيب أو علاقة، وهذا غير صحيح، بمعنى قد تفهم الخوارزمية أن أزرق (2) أكبر من أحمر (0)، وذلك غير منطقي. وأحيانًا يؤثر على أداء بعض الخوارزميات (مثل الانحدار الخطي) تتأثر سلبًا بالترتيب غير المنطقي الذي قد يضيفه LabelEncoder للبيانات الاسمية. بينما OneHotEncoder يقوم بتحويل القيم الفئوية إلى أعمدة ثنائية (0 أو 1) لكل فئة، أي ينشئ عمودًا جديدًا وفي حال القيمة في الصف تنتمي إلى تلك الفئة، يضع 1 في العمود المقابل، وإلا يضع 0. ويستخدم بشكل أساسي مع Nominal Categorical Data، حيث لا يوجد ترتيب منطقي بين الفئات، وأيضًا مع البيانات الترتيبية، ولكن ربما يؤدي إلى زيادة كبيرة في عدد الأعمدة (الأبعاد) في حال كان عدد الفئات كبيرًا. ميزته تجنب إدخال ترتيب غير مرغوب حيث لا يفرض أي ترتيب أو علاقة بين الفئات، بالتالي هو مناسب للبيانات الاسمية، بجانب أنه يساعد الخوارزميات على فهم البيانات الفئوية بشكل أفضل، خاصةً الخوارزميات التي تعتمد على المسافات أو العلاقات الخطية. ومن عيوبه أحيانًا زيادة كبيرة في عدد الأعمدة (الأبعاد) في حال عدد الفئات كبيرًا، بالتالي يؤثر على أداء بعض الخوارزميات أو يزيد من استهلاك الذاكرة. أيضًأ مشكلة التعدد الخطي Multicollinearity لو هناك علاقة خطية بين بعض الأعمدة الناتجة عن OneHotEncoder، الأمر الذي يؤثر على بعض الخوارزميات (مثل الانحدار الخطي)، وتستطيع حل المشكلة باستخدام تقنيات مثل حذف أحد الأعمدة أو استخدام Regularization.1 نقطة
-
وعليكم السلام ورحمة الله وبركاته، كلاهما يتم استخدامهما في معالجة البيانات وخصوصا عند التعامل مع المتغيرات الفئوية في تعلم الآلة أبرز الفروق بينهما هي كالآتي: أولا، LabelEncoder يستخدم لتحويل القيم النصية أو الفئوية (categorical) إلى قيم عددية (numeric) بحيث يتم إعطاء كل فئة رقما صحيحا ويتم استخدامه عندما تكون الفئات مرتبة أو عند الحاجة لتصنيف واحد فقط لكل فئة مثلا إذا كانت لديك قائمة بالفئات التالية: ['Red', 'Green', 'Blue'] فسيقوم بتحويلها إلى التالي: [0, 1, 2] أما OneHotEncoder فيحول كل فئة إلى مجموعة من الأرقام الثنائية (binary) بحيث يكون لكل فئة عمود منفصل، ويتم وضع 1 في العمود الذي يمثل الفئة والباقي 0 ونستخدمه عندما نحتاج إلى تمثيل غير مرتب للفئات مثلا إذا كان لدينا نفس القائمة السابقة فسيتم تحويلها إلى: Red Green Blue 1 0 0 0 1 0 0 0 1 لو تركز قليلا ستجد أنّ LabelEncoder يعطي تمثيلا عدديا بسيطا، بينما OneHotEncoder يفصل كل فئة في عمود مستقل، وهو أكثر شمولا للفئات غير المرتبة.1 نقطة
-
وعليكم السلام ورحمة الله وبركاته. إولا يجب عليك تحديد ما هو نوع المشروع الذي ستعمل عليه و الخصائص التي توجد به وأيضا هل سيكون جميع الأشخاص متصلين في نفس الوقت أم لا و أيضا هل سيحوي المشروع بيانات كبيرة جدا أم متوسطة أم صغيرة . حيث إمكانيات الجهاز تتوقف على جميع الأسئلة السابقة . فأولا إذا كان جميع الأشخاص سيعملون في وقت واحد و المشروع كبير ويقوم بتنفيذ أمور معقدة فهنا سيقوم بإستهلاك CPU كثيرة ولذلك سيتوجب عليك إستخدام معالج حديث وأقل شئ أن يكون ثنائي النواة و لكن الأفضل أن يكون أكثر من ذلك ويجب على التردد الخاص به أن يكون كبيرا وذلك حتى يستطيع تنفيذ أكثر من طلب في نفس الوقت ولا تجد بطئ أثناء تصفح العديد من الأشخاص في نفس الوقت . وأيضا ستحتاج إلى RAM أقل شئ 8 جيجا بايت ل 50 شخص في نفس الوقت والأفضل لو أكثر من ذلك مثلا 16جيجابايت أو 32 لأن نظام التشغيل سيستهلك من ال RAM أيضا . وأخيرا نأتي للتخزين . لو كان المشروع سيتم تخزين الكثير من الملفات عليه مثل الصور أو ملفات word و pdf فسيتوجب عليك الحصول على مساحة تخزين كبيرة لا تقل عن 256 جيجابايت ولو كانت البيانات سيتم حفظها لوقت طويل فيفضل إحضار قرص أكبر من ذلك ولنقل مثلا 512 جيجابايت . ويفضل أن يكون القرص من نوع SSD لأنه يتسم بالسرعة مما سيجعل المشروع لديك سريعا وخدم الكثير من الأشخاص في نفس الوقت بجانب المعالج. أما بخصوص المشروع فيمكنك تشغيله على الجهاز كالتالي من خلال هذا الأمر : python manage.py runserver 0.0.0.0:8000 وهكذا أى جهاز متصل بالشبكة المحلية يمكن الوصول إلى مشروعك من خلال عنوان ip الجهاز ومن ثم المنفذ . فلو كان عنوان الجهاز الذي يوجد به المشروع هو 192.168.1.100 سيمكنك الوصول إلى المشروع من خلال الشبكة المحلية على الرابط التالي : http://192.168.1.100:8000/ ولذلك سيتوجب عليك جعل الجهاز يأخذ static ip حتى لا يتغير ال ip بإستمرار ولا يستطيع أحد الوصول إلى المشروع . وأيضا سيتوجب عليك وضع الكود التالي في ملف settings.py ALLOWED_HOSTS = ['*']1 نقطة
-
1 نقطة
-
نستخدمها مثلاً لتقدير قيمة معينة على أساس عينة عشوائية، وتعطي فكرة عن مدى الثقة في تقدير تلك القيمة، وتساعد في تحديد مدى دقة التقدير. وبالتفصيل تظهر أهميتها في تقدير النطاق المحتمل للقيمة الحقيقية للمَعْلَمة حيث في الإحصاء، المعلمة Parameter هي قيمة عددية تصف خاصية لمجتمع إحصائي بأكمله (مثل متوسط الدخل لجميع سكان بلد ما). والعينات Samples ففي الواقع، غالبًا ما يكون من المستحيل أو المكلف قياس المعلمة مباشرة، بالتالي نأخذ عينة من المجتمع ونحسب إحصائية من تلك العينة (مثل متوسط الدخل في عينة من السكان). ومجال الثقة يوفر نطاقًا من القيم المحتملة التي قد تقع فيها المعلمة الحقيقية للمجتمع، حسب الإحصائية المحسوبة من العينة، وذلك النطاق يعطينا فكرة عن مدى دقة تقديرنا للمعلمة. أيضًا مفيدة في قياس عدم اليقين في التقديرات، فبسبب طبيعة العينات العشوائية الإحصائية المحسوبة من عينة واحدة قد تختلف قليلاً عن الإحصائية المحسوبة من عينة أخرى. ويعكس مجال الثقة ذلك التباين وعدم اليقين، فكلما كان مجال الثقة أوسع، زاد عدم اليقين في تقديرنا للمعلمة، ويرتبط عرض مجال الثقة بمستوى الثقة (مثل 95% أو 99%)، ومستوى الثقة يمثل نسبة العينات التي ستنتج فترات ثقة تحتوي على المعلمة الحقيقية للمجتمع. للتوضيح، لو كانت القيمة المتوقعة لارتفاع طالب في المدرسة الثانوية هي 175 سم، مع انحراف معياري قدره 5 سم، فإن مجال الثقة بنسبة 95% هي (165 سم، 185 سم)، وذلك يعني أن هناك 95% من الثقة في أن القيمة الحقيقية لارتفاع طالب في المدرسة الثانوية تقع بين 165 سم و185 سم. أو لو هناك دراسة طبية تقارن بين دواء جديد ودواء وهمي، فإن مجال الثقة سيوضح النطاق المحتمل للفرق في الفعالية بين الدوائين.1 نقطة
-
أهمية مجال الثقة في تحليل البيانات تكمن في قدرته على قياس مدى دقة وموثوقية التقديرات المستخلصة من العينة، حيث يحدد نطاقا يحتمل أن يحتوي على القيمة الحقيقية لمعلمة المجتمع الإحصائي بمستوى ثقة معين يساهم ذلك في إظهار درجة عدم اليقين في النتائج، دعم اختبار الفرضيات، وتوفير أساس لاتخاذ قرارات مدروسة، مما يجعل التحليل أكثر شمولية ودقة بدلا من الاعتماد على تقديرات نقطية قد تكون مضللة. أي أنّ مجال الثقة يضيف مصداقية لتحليل البيانات لأنه يظهر مدى دقة وموثوقية النتائج، ويقلل من الاعتماد على القيم المفردة التي قد تكون مضللة، مما يجعله أداة أساسية لتحليل البيانات الإحصائية يمكنك مطالعة المزيد حوله من هنا:1 نقطة
-
ما الهدف من العمود؟ في كثير من الأحيان سيكون ذلك لتجميع فئات أقل شيوعًا أو ذات أهمية ثانوية، أي قبل أي شيء، حاول فهم ما الذي يمثله Other، هل هو تجميع لفئات محددة؟ هل هو فئة افتراضية؟ أيضًا تفقد هل ذلك لا يمثل بيانات مفقودة أو غير صحيحة، فربما تحتاج إلى تنظيف البيانات إن كان الأمر كذلك. بالتالي في حال كانت تمثل فئة ذات معنى في التحليل، أو تريد الحفاظ على جميع الفئات الأصلية فلا تحتاج إلى فعل أي شيء، من الممكن إعادة التسمية في تلك الحالة. وفي حال كانت تمثل فئات صغيرة فيمكن دمجها مع فئة أخرى ذات صلة. أما في حال تمثل فئات غير محددة فقم بتوزيعها بناءًا على نسبة معينة، لكن تلك الطريقة أكثر تعقيدًا وتتطلب فهمًا أعمق للبيانات لديك. وفي حال تمثل نسبة صغيرة جدًا من البيانات ولا تؤثر بشكل كبير على التحليل، قم بحذفها، وهناك طريقة أخرى وهي التعامل معها كبيانات مفقودة NaN في التحليل.1 نقطة
-
الطريقة الأبسط هي تشغيل سيرفر المشروع كما تفعل أثناء التطوير وستتمكن من الوصول للمشروع من خلال الـ IP الخاص بجهازك ثم رقم المنفذ وهو 8000 إفتراضيًا لمشاريع جانغو. أي لو كان عنوان جهازك هو 192.168.12.1 فتستطيع الوصول للمشروع من خلال أي جهاز بكتابة التالي في المتصفح: 192.168.12.1:8000 وقم بإضافة التالي للإعدادادت للسماح بالإتصال من العناوين المختلفة: ALLOWED_HOSTS = ['*'] بالنسبة للمواصفات فالمعالج يعتمد على نوع المشروع لكن معالج رباعي النواة أو أفضل حديث سيوفي الغرض، بالإضافة إلى 16 جيجابايت على الأقل (يفضل 32 جيجابايت أو أكثر)، وللتخزين 256-512 جيجابايت من نوع SSD. وبطاقة شبكة تدعم سرعة 1 جيجابت في الثانية. هناك طريقة أخرى إحترافية أكثر وهي من خلال nginx + gunicorn1 نقطة
-
الا فيه قيمه مفقود بس الدالة value_counts() تتجاهل القيم المفقودة (NaN) افتراضيًا. لا تعرض الدالة value_counts() القيم المفقودة (NaN) افتراضيًا. لجعلها تظهر، استخدم dropna=False: الف شكرااا لحضرتك جدا جزاك الله كل خير1 نقطة
-
1 نقطة
-
السلام عليكم ورحمة الله تعالى وبركاته أنا أدرس البرمجة ومقبل على امتحانات بألمانيا اشتركت بهده الدورة لأقوي معرفتي بالبرمجة الامتحانات هنا بألمانيا هي فقط أسإلة لحل مسائل بطريقة البسودوكود هل ممكن أحد يساعدني كيف أتعامل مع المسائل لإيجاد الحلول بسهولة شكرا للدعم1 نقطة
-
1 نقطة
-
يرجى اضافة المراجع التي اخذت منها المعلومات ما نسبة الاستخدام لكل اللغات المستخدمه في الback end1 نقطة
-
إذا كنت تقصد أن type الخاص بعمود في DataFrame هو "Other"، فهذا يعني أن نوع العمود ربما يحتوي على قيم مختلطة، مثل وجود أرقام ونصوص معا، أو أيضا إذا كان هناك قيم مفقودة بجانب قيم أخرى. لذا قم بفحص القيم الموجودة في العمود، و إذا كنت تعرف نوع البيانات المتوقع، يمكنك تحويل العمود: print(df['column_name'].unique()) لتحويل إلى نصوص: df['column_name'] = df['column_name'].astype(str) لتحويل إلى أرقام: df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce') بالنسبة ل errors='coerce' يحول القيم غير القابلة للتحويل إلى NaN.1 نقطة
-
السلام عليكم هل هناك مرجع او مذكرة للاوامر والكلاسات وهكذا؟1 نقطة
-
وعليكم السلام ورحمة الله وبركاته. نعم بالطبع يمكنك استخدام الدالة describe() مع بيانات من نوع object . و عندما تستخدم describe على عمود يحتوي على بيانات من نوع object ستحصل على بعض الإحصائيات الوصفية الخاصةبهذا العملود مثل: import pandas as pd data = {'name': ['mohamed', 'ahmed', 'mohamed', 'sara', 'ahmed']} df = pd.DataFrame(data) description = df['name'].describe() print(description) النتيجة ستكون كالتالي: count 5 unique 3 top mohamed freq 2 Name: name, dtype: object ستجد أن count هو عدد القيم في العمود. و unique هي عدد القيم الفريدة في العمود و top القيمة الاكثر تكرارا في العمود و freq هي عدد المرات التي ظهرت فيها قيم ال top1 نقطة
-
وعليكم السلام ورحمة الله, إن كنت تقصد أن نكون من كائن مباشرة فلا يمكننا كالمثال التالي: import pandas as pd class Monster: def __init__(self, HP, MP, power): self.HP = HP self.MP = MP self.power = power monster = Monster(50, 17, 22) df = pd.DataFrame(monster) print(df.describe()) فهذا يظهر خطأ لأن ال object هنا هو عبارة عن pointer لمكان تخزين المعلومات الخاصة بالكائن وليست معلومات. إن كان لديك قصد اخر ولم أفهمه فأرجو التوضيح لكي أستطيع المساعدة.1 نقطة
-
لاحظ البيانات التي أرسلتها . لا يوجد بها أى قيمة فارغة . ولهذا لا يتم إستبدال القيم ب NaN . Poor 8802 Intermediate 6376 Favorable 3011 TBD 1341 Normal 643 Other 504 Not tested 55 هل يمكنك توضيح ما هي القيم التي تظن أنها فارغة في البيانات السابقة التي أرسلتها ؟ أعتقد أن جميع البيانات موجودة ولا توجد أى قيمة أو حقل فارغ. فقط يتم إستبدال الخانات أو الحقول الفارغة ب NaN1 نقطة
-
عند تنفيذ مشروع على مستقل يتم خصم قيمة المشروع مقدمًا من قبل العميل واحتجازها على منصة مستقل ثم تسليمها إليكِ بعد تسليم المشروع للعميل ووافق هو على الاستلام. في حال تغيب لأسباب مختلفة وتم الإنتهاء من المشروع وتوفير الملفات اللازمة في محادثة المشروع، تتواصلين مع مركز المساعدة للمنصة وسيتم مراسلته أكثر من مرة لذا الأمر قد يطول قليلاً شهر ربما أو أقل، لكن لا داعي للقلق بخصوص حقوقك المالية.1 نقطة