Ali Ahmed55 نشر 23 أكتوبر أرسل تقرير نشر 23 أكتوبر السلام عليكم انا منزل بيانات مرض السكري من kaggle بس ملفين منفصلين ملف Training.csv و Testing.csv بس انا كانت عاوز ادمج الملفين دول عشان التحليل فا كيف ادمج ملفين من نوع CSV بستخدم لغه باثيون ؟ 1 اقتباس
0 محمد عاطف17 نشر 23 أكتوبر أرسل تقرير نشر 23 أكتوبر وعليكم السلام ورحمة الله وبركاته. يمكنك استخدام مكتبة pandas لدمج الملفين كالتالي : import pandas as pd # قراءة ملف التدريب وملف الاختبار train_df = pd.read_csv('Training.csv') test_df = pd.read_csv('Testing.csv') # دمج الملفين merged_df = pd.concat([train_df, test_df], axis=0) # حفظ الملف المدموج كملف CSV جديد merged_df.to_csv('Merged_data.csv', index=False) وهكذا سنقوم أولا بقراءة الملفات ووضعهم في متغيرات . ومن ثم دمجهم في متغير جديد عن طريق دالة concat ومن ثم نقوم بحفظ البيانات المدمجة في ملف جديد. 1 اقتباس
0 Ali Ahmed55 نشر 23 أكتوبر الكاتب أرسل تقرير نشر 23 أكتوبر بتاريخ 6 دقائق مضت قال محمد عاطف17: وعليكم السلام ورحمة الله وبركاته. يمكنك استخدام مكتبة pandas لدمج الملفين كالتالي : import pandas as pd # قراءة ملف التدريب وملف الاختبار train_df = pd.read_csv('Training.csv') test_df = pd.read_csv('Testing.csv') # دمج الملفين merged_df = pd.concat([train_df, test_df], axis=0) # حفظ الملف المدموج كملف CSV جديد merged_df.to_csv('Merged_data.csv', index=False) وهكذا سنقوم أولا بقراءة الملفات ووضعهم في متغيرات . ومن ثم دمجهم في متغير جديد عن طريق دالة concat ومن ثم نقوم بحفظ البيانات المدمجة في ملف جديد. تمام , بس عند تدريب النموذج استخدم الملف الجديد صح ؟ 1 اقتباس
0 محمد عاطف17 نشر 23 أكتوبر أرسل تقرير نشر 23 أكتوبر بتاريخ الآن قال Ail Ahmed: تمام , بس عند تدريب النموذج استخدم الملف الجديد صح ؟ لا يفضل تمرين النموذج عليه فكيف ستحصل على بيانات جديدة للإختبار ومعرفة دقة النموذج الخاص بك ؟! ولكن إذا أردت ذلك لا مشكلة يمكنك تمرين النموذج على الملف الجديد وستجده يحتوي بيانات الملفين Training.csv و Testing.csv اقتباس
0 Ali Ahmed55 نشر 23 أكتوبر الكاتب أرسل تقرير نشر 23 أكتوبر بتاريخ الآن قال محمد عاطف17: لا يفضل تمرين النموذج عليه فكيف ستحصل على بيانات جديدة للإختبار ومعرفة دقة النموذج الخاص بك ؟! استخدم الداله rain_test_split hgl الموجود في مكتبه sklearn عشان لو فيه قيه متظرفه او بيانات مش صحيح فا مش هيتدم تعديلاها في م Training.csv و Testing.csv فا الافضل ان استخدم الملف الجديد في تدريب النموذج عشان التعدلات الاهتحصل علي البيانات داله ال train_test_split اقتباس
السؤال
Ali Ahmed55
السلام عليكم
انا منزل بيانات مرض السكري من kaggle بس ملفين منفصلين ملف Training.csv و Testing.csv بس انا كانت عاوز ادمج الملفين دول عشان التحليل فا كيف ادمج ملفين من نوع CSV بستخدم لغه باثيون ؟
4 أجوبة على هذا السؤال
Recommended Posts
انضم إلى النقاش
يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.