مراجعة لمشروع تعلم آلي قمت به

12 يونيو

https://colab.research.google.com/drive/1SxeCyH5AtfzvFYMghuBts9UKqJRItd9V?usp=sharing&pli=1

Mustafa Suleiman · 12 يونيو

لم أتفهم المطلوب، لكن تفقدت المشروع لديك، وقد قمت بالمطلوب لا مشكلة ما عدا جزئية واحدة، وهو تحميل وتنظيف البيانات بتحميل الملف Books Recommendation System.csv، واختيار الأعمدة المطلوبة، وحذف الصفوف التي تحتوي على قيم فارغة بنجاح.

ثم المعالجة المسبقة للنصوص بإنشاء دالة preprocess تقوم بتحويل النص إلى أحرف صغيرة، وتقسيمه إلى tokens، وإزالة علامات الترقيم والكلمات الشائعة.

ثم قمت بإنشاء المتجهات بواسطة نموذج SentenceTransformer بنجاح لتحويل الأوصاف المُعالَجة إلى متجهات رقمية، مع عرض الكتب العشرة الموصى بها بشكل جيد (العنوان، الفئة، الوصف).

بعد ذلك أنشئت bar chart لعرض متوسط تقييمات أفضل 5 كتب موصى بها.

ما لم تقم به هو في الخطوة الرابعة حيث ُطلب منك استخدام مكتبة faiss لإنشاء فهرس للبحث الفعال عن التشابه، وأنت قمت بالفعل بإنشاء فهرس faiss:

index = faiss.IndexFlatL2(embeddings.shape[1])
index.add(embeddings)

ولكنه لا يستخدم الفهرس للبحث عن الكتب المشابهة، بل يعتمد على مكتبة sklearn لحساب التشابه بواسطة cosine_similarity، كالتالي:

similarities = cosine_similarity(user_embedding, embeddings)[0]
top_10_indices = similarities.argsort()[-10:][::-1]

فالهدف من استخدام faiss هو السرعة والكفاءة في البحث عن أقرب الجيران، خاصة مع مجموعات البيانات الضخمة، بينما cosine_similarity من sklearn يقوم بمقارنة متجه المستخدم مع كل المتجهات الأخرى في مجموعة البيانات، وهو ما يصبح بطيئًا جدًا مع زيادة عدد الكتب.

عليك تعديل الكود إلى:

distances, top_10_indices = index.search(user_embedding, k)

top_10_indices = top_10_indices[0]

12 يونيو

https://colab.research.google.com/drive/1SxeCyH5AtfzvFYMghuBts9UKqJRItd9V?usp=sharing&pli=1#scrollTo=5GuHu6rfFpf7 قصدي هذا كود بعثتو مبيين بخط يدوي ولا يظهر من أدوات الذكاء الاصطناعي ؟؟

مراجعة لمشروع تعلم آلي قمت به

السؤال

اويس عبد الباسط ذياب بني ملحم

2 أجوبة على هذا السؤال

Recommended Posts

Mustafa Suleiman

اويس عبد الباسط ذياب بني ملحم

انضم إلى النقاش

إعلانات

تابعنا على

الرئيسية

كيف أتعلم؟

تابعنا

دروس ومقالات

أسئلة وأجوبة

كتب

دورات

بطاقات هدية