تحياتي لك
هذا الكود يعمل فعلا على استخراج أول 5 أرقام فقط ثم يعد 5 حروف ويستخرج الأرقام ثم يعد 10 حروف ويستخرج الأرقان وهكذا
ولكن بعد محاولات كثيرة وجدت الكود الصحيح الذي يعمل بغض النظر عن عدد الكلمات بين كل مجموعة من الأرقام
import pandas as pd
import re
# Open the Excel file
excel_file = 'F:/data_set_extract_digits.xlsx'
df = pd.read_excel(excel_file, sheet_name='sheet1')
# Extract consecutive groups of 5 digits in new columns
df['First Five Digits'] = df['column1'].apply(lambda x: re.findall(r'\d{5}', str(x))[0] if re.findall(r'\d{5}', str(x)) else '')
df['Second Five Digits'] = df['column1'].apply(lambda x: re.findall(r'\d{5}', str(x))[1] if len(re.findall(r'\d{5}', str(x))) > 1 else '')
df['Third Five Digits'] = df['column1'].apply(lambda x: re.findall(r'\d{5}', str(x))[2] if len(re.findall(r'\d{5}', str(x))) > 2 else '')
# Save the extracted data as a new Excel file
output_file = 'F:/result.xlsx'
df.to_excel(output_file, index=False)
print("Extracted data saved successfully!")
مرفق ملف للتجربة
data_set_extract_digits.xlsx