اذهب إلى المحتوى

Mohamed Elnemr

الأعضاء
  • المساهمات

    54
  • تاريخ الانضمام

  • تاريخ آخر زيارة

  • عدد الأيام التي تصدر بها

    1

كل منشورات العضو Mohamed Elnemr

  1. لدي بيانات على هيئة اثنان dataframes كالتالي: from pandas import DataFrame df1 = DataFrame({'col1':[a,b],'col2':[c,d]}) df2 = DataFrame({'col3':[e,f]}) أريد ضرب كلا ال dataframes بحيث يكون على الخرج على هذا الشكل: col1 col2 col3 0 a c e 1 a c f 2 b d e 3 b d f كيف يمكنني فعل هذا؟
  2. لدي بيانات على شكل dataframe كالتالي: USAF WBAN year month day piece1 piece2 temp sum sum max min 0 702730 26451 1993 1 1 0 13 30.92 24.98 1 702730 26451 1993 1 2 0 13 32.00 24.98 2 702730 26451 1993 1 3 10 13 23.00 6.98 3 702730 26451 1993 1 4 0 13 10.04 3.92 4 702730 26451 1993 1 5 0 13 19.94 10.94 أريد أن أقوم بتسطيحها بحيث تصبح على الشكل التالي: USAF WBAN year month day piece1 piece2 temp_max temp_min 0 702730 26451 1993 1 1 0 12 30.92 24.98 1 702730 26451 1993 1 2 0 13 32.00 24.98 2 702730 26451 1993 1 3 10 2 23.00 6.98 3 702730 26451 1993 1 4 0 12 10.04 3.92 4 702730 26451 1993 1 5 0 10 19.94 10.94 كيف يمكنني فعل هذا؟
  3. لدي البيانات التالية في pandas على هيئة dataframe كالتالي: col1 animal A Cat A Dog B Bird B Bat وأود أن أدمج العناصر التي لها نفس القيمة في العمود col1 بحيث تصبح على الشكل التالي: A Cat-Dog B Bird-Bat حاولت استخدام الكود التالي: group = df.groupby(['col1'])['animal'].sum().apply(lambda x: '-'.join(x)) لكن الشكل الخارج يكون مختلفاً عما أريد: A C-a-t-T-i-g-e-r B B-a-l-l-B-a-t كيف يمكنني أن اظهرها بالشكل السليم؟
  4. لدي بيانات في شكل اثنان dataframes كالتالي: df1 = DataFrame([[10],[20],[30],[40],[50]], index=['one','two','three','four','five'], columns=['number']) number one 10 two 20 three 30 four 40 five 50 df2 = DataFrame([['a'],['b'],['c'],['d'],['e']], index=['two','four','one','three','five'], columns=['letter']) letter two a four b one c three d five e وأريد انشاء dataframe جديدة تقوم بدمجهم معا عن طريق المقارنة بين ال index وجمع ما هو متشابه سويا بحيث يكون الخرج كالتالي: number letter one 1 a two 2 b three 3 c four 4 d five 5 e مع ملاحظة أن العناصر ليست مرتبة سوياً حتى أستطيع دمجهم مباشرة وانما يجب البحث عن التشابهة أولا قبل الدمج. كيف يمكنني فعل هذا؟
  5. لدي بيانات على شكل dataframe وأريد فقط الإبقاء على البيانات التي تحتوي قيم العمود value على قيم لا تساوي NaN >>> df ID value cash ID Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN بحيث يكون الخرج النهائي كالتالي: ID value cash ID Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN كيف يمكنني فعل هذا؟
  6. لدي بيانات ذات حجم 20x4000 على شكل Dataframe. اثنان من الأعمدة في تلك ال dataframe هما year و month وأريد عمل متغير جديد يدعي period يقوم بدمج العمود year بجانب العمود month كالتالي: year month period 2021 june 2021june كيف يمكنني عمل هذا؟
  7. أحاول انشاء ملف اكسيل excel وكتابة بعض القيم فيه باستخدام pandas كالتالي: import pandas writer = pandas.ExcelWriter('test.xlsx') data_filtered.to_excel(writer, "Main", cols=['col1', 'col2']) writer.save() الملف test.xlsx يحتوى بالفعل على عدد من علامات التبويب tabs ، لكنه لا يحتوى على علامة تبويب بإسم "Main" ، ومع ذلك عند استخدام هذا الكود فانه يقوم بانشاء التبويب "Main" لكنه يحذف باقي tabs الأخرى، كيف يمكنني إضافة "Main" دون التعديل في باقي الملف؟
  8. لدي بيانات على شكل Dataframe وأريد استبدال قيم بعض العناصر التي تتخطى قيمتها 100 وأقوم بجعلها تساوى الصفر، فكرت باستخدام الكود التالي: df[df.my_channel > 100].my_channel = 0 لكنه لم يفلح، كيف يمكنني فعل هذا؟
  9. لدي بيانات على هيئة dataframe حيث تحتوي علي عمود به التاريخ على الشكل التالي: 1/1/2021 والذي يتم تعريفة تلقائية بالنوع object قمت باستخدام الكود التالي لتحويل نوعه : df['DOB'] = pd.to_datetime(df['DOB']) >>> dtype: DOB datetime64[ns] لكن شكله تحول لهذا الشكل 2021-08-26. أريد أن أقوم بتحويله بحيث يكون على هذا الشكل 08/26/2021، كيف يمكنني فعل هذا؟
  10. أريد أن أزيد من عدد الأعمدة التي تظهر على الشاشة عن استخدام dataframes، فمثلا عندما أقوم باستخدام دالة describe على dataframe وكان عدد الأعمدة أكبر من 5 لا تظهر كل الأعمدة بل تظهر التالي: >> Index: 8 entries, count to max >> Data columns: >> 1 8 non-null values >> 2 8 non-null values >> 3 8 non-null values >> 4 8 non-null values >> 5 8 non-null values >> 6 8 non-null values >> 7 8 non-null values كيف يمكنني زيادة حجم الشاشة لتظهر عدد أكثر من الأعمدة؟
  11. لدي بيانات على الشكل التالي: Station ID Pollutants 1000 {"col1": "46", "col2": "3", "col3": "12"} 1001 {"col1": "36", "col1": "5", "col3": "8"} 1002 {"col2": "2", "col3": "7"} 1003 {"col3": "11"} 1004 {"col1": "82", "col3": "15"} وأريد تحويلها الى الشكل dataframe بحيث يكون العمود الثاني pollutants متقسم الى عدة أعمدة كالتالي: Station ID col1 col2 col3 1000 46 3 12 1001 36 5 8 1002 NaN 2 7 1003 NaN NaN 11 1004 82 NaN 15 كيف يمكنني أن أفعل هذا بسهولة؟
  12. أريد عمل Dataframe بحيث يتم إضافة محتواها صف بصف وليس انشاءها كاملة من البداية. قمت بعمل Dataframe فارغة تحتوي فقط على أسماء الأعمدة : res = DataFrame(columns=('Col1', 'Col2', 'Col3')) كيف يمكنني إصافة بيانات سواء كانت عددية أو حروف؟
  13. لدي البيانات التالية على شكل dataframe A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A أريد إزالة الصفوف التي تتشابة فيها قيم عمودين، على سبيل المثال أريد إزالة الصفوف التي تتشابه فيها قيم العمود A والعمود C لذا في المثال السابق سنقوم بحذف الصفين 0 و 1. أعرف أن الدالة drop_duplicates تحذف الصفوف التي تتشابه جميع قيمها، لكن هنا أريد تحديد أعمدة بعينها، كيف يمكنني فعل هذا؟
  14. لدي عدة ملفات على شكل csv وأريد تحميلهم في pandas على هيئة dataframes بحيث يتم دمجهم سويا في dataframe واحدة كبيرة، حاولت إستخدام الكود التالي لكنه لم يفلح: import glob import pandas as pd # تحميل الملفات path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # جمع الملفات في ملف واحد big_frame = pd.concat(dfs, ignore_index=True) كيف يمكنني فعل هذا؟
  15. لدي إثنان dataframes على الشكل التالي بحيث تحتوى الأولى على الأسم والسن وتحتوي الثانية على الأسم أيضا مع جنس الشخص، لكن ليس كل الأشخاص موجودين في كلتا ال dataframes كالتالي: df1 Name Age 0 Tom 34 1 Sara 18 2 Eva 44 3 Jack 27 4 Laura 30 df2 Name Sex 0 Tom M 1 Paul M 2 Eva F 3 Jack M 4 Michelle F أود أن أقوم بدمجهم سويا مع جعل القيم غير الموجودة ب nan كالتالي: df1 Name Age Sex 0 Tom 34 M 1 Sara 18 NaN 2 Eva 44 F 3 Jack 27 M 4 Laura 30 NaN كيف أقوم بهذا؟
  16. لدي مجموعة من البيانات التالية In [2]: df Out[2]: col1 col2 col3 col4 col5 col6 0 A B 0.20 -0.61 -0.49 1.49 1 A B -1.53 -1.01 -0.39 1.82 2 A B -0.44 0.27 0.72 0.11 3 A B 0.28 -1.32 0.38 0.18 4 C D 0.12 0.59 0.81 0.66 5 C D -0.13 -1.65 -1.64 0.50 6 C D -1.42 -0.11 -0.18 -0.44 7 E F -0.00 1.42 -0.26 1.17 8 E F 0.91 -0.47 1.35 -0.34 9 G H 1.48 -0.63 -1.14 0.17 أود عمل تجميع لها في شكل مجموعات باستخدام groupby ثم حساب بعض القيم الإحصائية لكل مجموعة، حاولت استخدام الكود التالي لكنه لم يفلح: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() كيف يمكن أن أقوم بهذا؟
  17. لدي dataframe بها 4 أعمدة، إثنان منهم عبارة عن كلمات string، كنت أتساءل عما إذا كانت هناك طريقة لتحديد الصفوف بناءً على قيمة معينة موجودة في عمود ما، بمعني أصح ، أريد دالة في Pandas تقوم بأداء مماثل تلك الدالة: re.search(pattern, cell_in_question) حاولت بالفعل تجربة هذا الكود لكن لا أظنه صحيحا: df[df['A'] == "hello world"] ما الحل في هذا؟
  18. لدي بيانات على الشكل التالي: df = pd.DataFrame({"Fruits": [["Apple", "Oragne"] for i in range(7)]}) Fruits 0 [Apple, Orange] 1 [Apple, Orange] 2 [Apple, Orange] 3 [Apple, Orange] 4 [Apple, Orange] 5 [Apple, Orange] 6 [Apple, Orange] وأود أن أقوم بفصل العمود الثاني الذي هو عبارة عن صف الى عمودين مختلفين كالتالي: Fruit1 Fruit2 0 Apple Orange 1 Apple Orange 2 Apple Orange 3 Apple Orange 4 Apple Orange 5 Apple Orange 6 Apple Orange كيف أستطيع أن أقوم بهذا؟
  19. أحاول دمج أعمدة dataframes بحيث تكون عمود جديد شكلة مختلفة عن الأعمدة الموجودة لكنه يتكون في الأساس منهم رغم إختلاف الرموز tokens. كمثال لدي تلك البيانات على شكل dataframe: dataframe = pd.DataFrame({'col_1' : ['a','b','c','d'], 'col_2' : ['name_a','name_b','name_c','name_d'], 'col_3' : ['age_a','age_b','age_c','age_d']}) وأود أن يتم دمجها بحيث تخرج بالشكل التالي: features 0 a <0> name_a <1> age_a 1 b <0> name_b <1> age_b 2 c <0> name_c <1> age_c 3 d <0> name_d <1> age_d مع مراعاة عدم التغيير في البيانات الأصلية. كيف أقوم بفعل هذا؟
  20. لدي بيانات على شكل dataframe، وأود إيجاد عدد الصفوف بداخل تلك البيانات، حاولت أستخدام هذا الكود لكنه لا يفلح: total_rows = df.count print (total_rows + 1) ما هي الطريقة التي يمكنني عد الصفوف بها؟
  21. لدي تلك البيانات على شكل dataframe import pandas as pd data = [{'a':1, 'b':2}, {'a':3,'b':4}, {'a':5,'b':6}] df = pd.DataFrame(data) أريد أن أقوم بعمل حلقة تكرارية بإستخدام for للصفوف بداخل ال dataframe، حاولت بأكثر من طريقة ولم تفلح، كيف يمكنني أن أقوم بفعلها؟
  22. لدي تلك البيانات على شكل dataframe Fruit Date Name Number Mangos 10/6/2016 Ahmed 7 Mangos 10/6/2016 Ahmed 8 Mangos 10/6/2016 Mike 9 Mangos 10/7/2016 Steven 10 Mangos 10/7/2016 Ahmed 1 Banana 10/7/2016 Ahmed 2 Banana 10/6/2016 Tom 15 Banana 10/6/2016 Mike 57 Banana 10/6/2016 Ahmed 65 Banana 10/7/2016 Tony 1 pineapple 10/7/2016 Ahmed 1 pineapple 10/7/2016 Tom 87 pineapple 10/7/2016 Ahmed 22 pineapple 10/7/2016 Ahmed 12 pineapple 10/7/2016 Tony 15 وأود تجميع تلك البيانات بالإسم name وكذلك الفاكهة Fruit، كالمثال التالي: Bob,Mangos,16 #( على سبيل المثال ) كيف يمكنني عمل ذلك؟
  23. لدي بيانات علي شكل dataframe في pandas: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) وأود أن أقوم بتحويل نوع بعض الأعمدة من نوع الى أخر، مثلا من string إلى int64 أو الى float، كيف يمكنني فعل ذلك؟
  24. لدي بيانات على شكل dataframe في pandas، وهناك بعض الأعمدة التي أود تحويل قيمها كلها الى قيم عددية بدلا من خليط من الأعداد الحروف، كالمثال التالي: s = pd.Series(["8", 6, "7.5", 3, "0.9"]) # خليط من الأرقام والحروف كيف يمكنني جعلها كلها قيماً عددية؟
  25. لدي بيانات على شكل dataframe ، وأود أن أقوم بعمل دالة بحيث يتم تطبيقها على تلك البيانات كلها. على سبيل المثال عمل دالة لتحديد اذا كانت القيمة مرتفعة أو متوسطة أو منخفضة بناء على قيمة العنصر العددية، كيف يمكن عمل هذا؟
×
×
  • أضف...