اذهب إلى المحتوى

Saddam Alwaheab

الأعضاء
  • المساهمات

    17
  • تاريخ الانضمام

  • تاريخ آخر زيارة

آخر الزوار

لوحة آخر الزوار معطلة ولن تظهر للأعضاء

إنجازات Saddam Alwaheab

عضو مساهم

عضو مساهم (2/3)

27

السمعة بالموقع

  1. ملف واحد واحتاج الى كتابة اسكربت بايثون لهذا العمل import pandas as pd from sentence_transformers import SentenceTransformer, util # Load data df = pd.read_excel("files/similar_services.xlsx") texts = df["name"].astype(str).tolist() # Load multilingual model model = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2") # Encode into embeddings embeddings = model.encode(texts, convert_to_tensor=True, show_progress_bar=True) # Compute cosine similarity matrix cosine_scores = util.cos_sim(embeddings, embeddings) # Collect similar pairs matches = [] threshold = 0.80 # Adjust threshold as needed for i in range(len(texts)): for j in range(i + 1, len(texts)): score = cosine_scores[i][j].item() if score >= threshold: matches.append({ "service_1": texts[i], "service_2": texts[j], "similarity": round(score, 3) }) similar_df = pd.DataFrame(matches) similar_df.to_excel("similar_services_output.xlsx", index=False) print("Done. Saved to similar_services_output.xlsx") سويت هذا الكود بس الامور ما ظبطت
  2. اعمل في مجمع طبي ولدي حوالي 1500 خدمة وهناك خدمات مكررة ولكن صعب اكتشافها واحتاج افضل حل لا استخراج الخدمات المتشابهه سوا بالنص تماما او المعنى او يكون في نسبة تشابة بالمعنى طبعا الخدمات مكتوبه بالعربي والانجليزي بنفس الحقل كما موضح في الصورة اسفل
  3. ما هي أفضل الممارسات لبناء نظام دردشة ذكي لخدمة العملاء على موقع إلكتروني؟ وهل من الأفضل أن يتم تدريب النموذج خارجيًا (مرة واحدة ثم استخدامه فقط للاستدلال) أم يمكن إنشاء آلية تدريب وتحديث للنموذج بشكل مستمر داخل المشروع نفسه؟
  4. هل توجد نماذج اختبارات سابقة؟ هل يجب عليّ مراجعة محتوى الدورة بعد إنهائها للتأكد من احتفاظي بالمعلومات؟ هل تكون الأسئلة نظرية أم عملية؟ وهل يتم تقديم الاختبار عبر الموقع نفسه أم بطريقة أخرى؟؟
  5. نحن قمنا بعمل مسابقة داخل قناة واتساب للطلاب، بحيث نقوم نحن بنشر رسالة داخل القناة تحمل اسم كل طالب مشارك، ثم يتفاعل بقية الطلاب مع هذه الرسالة (ردود فعل 👍❤️🔥 وغيرها). يحصل الطالب الذي يجمع أكبر عدد من التفاعلات على رسالته على الجائزة. المشكلة التي اكتشفناها أن بعض الطلاب ربما لجأ إلى استخدام أدوات أو سكربتات لتوليد تفاعلات وهمية بهدف رفع عدد التفاعلات بشكل غير عادل. 🔍 ما نحتاجه بالضبط: استخراج أسماء الطلاب من رسائل القناة مع جميع تفاصيل التفاعل لكل رسالة. تحليل هذه البيانات لاحقًا لتحديد التفاعلات الطبيعية من التفاعلات الوهمية (مثلاً: نفس الحساب يكرر التفاعل خلال ثوانٍ، أو عشرات التفاعلات من نفس الجهاز أو نفس الحسابات الوهمية). ⚙️ ما تم تنفيذه حتى الآن: حاولنا استخدام Selenium مع Python للوصول للرسائل وقراءة التفاعلات عبر المتصفح باستخدام web scraping. استخدمنا Headless Mode لكن بعض العناصر لم تظهر (مثل زر القنوات)، وتم تجاوز جزء من المشاكل باستخدام WebDriver Manager. حاليًا نحاول إيجاد أفضل طريقة للوصول لكل رسالة، ثم فتح نافذة التفاعلات (Dialog) لكل رسالة، ثم جمع البيانات بدقة. 🧩 أسئلتي للمختص: 1️⃣ هل توجد طريقة أفضل أو أكثر استقرارًا من Selenium لاستخراج بيانات من قناة واتساب عبر الويب؟ 2️⃣ كيف يمكن ضمان تجاوز حظر العناصر أو القيود التي يطبقها واتساب أحيانًا عندما يكتشف التشغيل التلقائي (Headless Detection)؟ 3️⃣ هل لديك مقترحات عملية لـ تحليل التفاعلات لاكتشاف الأنشطة المزيفة بشكل تقني (مثل الأنماط الزمنية، IP المتكرر، أو تكرار الأجهزة)؟ 🎯 الهدف النهائي: استخراج النتائج بدقة ومنع الغش في التفاعلات لتحقيق العدالة في المسابقة.
  6. ما هي افضل اداه او موقع او تطبيق لتحويل النص الى فديوا احترافي؟
×
×
  • أضف...