اذهب إلى المحتوى

السؤال

نشر

السلام عليكم ورحمة الله وبركاته

إن كان لدي عدد كبير من البيانات ما يقارب 1000

وأود تدريب  GPT عليه، لمهمة التلخيص وتصنيفه حسب تصنيف معين في ال Dataset

كما انني اريد من النظام الرد على المستخدم بناءً على التصنيف 

فما هي الخطة المناسبة 
والآلية التي اتبعها للتدريب بشكل صحيح وبدون إهدار للموارد

وإن امكن توضيح الية التدريب من ملف CVS 
 

Recommended Posts

  • 0
نشر

قم بإعداد بياناتك في ملف CSV يحتوي على النصوص، التلخيصات، والتصنيفات، ثم قسمها إلى مجموعات تدريب واختبار، و استخدم Fine-Tuning لتخصيص نموذج GPT-3.5 أو GPT-4 عبر OpenAI API أو مكتبة Hugging Face، مع OpenAI حول البيانات إلى تنسيق JSONL وابدأ التدريب باستخدام واجهة CLI، أما مع Hugging Face قم بتحميل نموذج مسبق التدريب مثل GPT-2، وجهز بياناتك باستخدام مكتبة datasets، ثم استخدم Trainer لتدريب النموذج محليا، و بعد التدريب استخدم النموذج للرد على المستخدم وفقا للتصنيفات، وأيضا لتوفير الموارد اختر نماذج أصغر أو قلل حجم البيانات أثناء التدريب، وقيم أداء النموذج باستخدام مجموعة اختبار لتحسين النتائج.

  • 0
نشر

لتدريب نموذج GPT على بيانات التلخيص والتصنيف بكفاءة ودون إهدار للموارد، يمكنك استخدام استراتيجية التخصيص (Fine-Tuning) لنموذج جاهز مثل GPT-2 أو GPT-3.5 بداية يمكنك البدء بإعداد بياناتك في ملف CSV بحيث يحتوي على النصوص، التصنيفات، والملخصات المطلوبة، مع تقسيم البيانات إلى 80% للتدريب، و20% للاختبار والتحقق ولكن تأكد من تنظيف البيانات بإزالة التكرار والأخطاء وبعد ذلك ستتمكن من استخدام أدوات مثل مكتبة Hugging Face لتخصيص النموذج على بياناتك لعدد محدود من الدورات التدريبية (Epochs) لتوفير الوقت وبعد إتمام التدريب يأتي الدور على اختبار النموذج للتأكد من دقته ثم توظيفه في النظام ليقوم بتلخيص النصوص والرد على المستخدمين وفقا للتصنيفات المحددة.

  • 0
نشر
بتاريخ On 9‏/12‏/2024 at 11:40 قال عبد الوهاب بومعراف:

قم بإعداد بياناتك في ملف CSV يحتوي على النصوص، التلخيصات، والتصنيفات، ثم قسمها إلى مجموعات تدريب واختبار، و استخدم Fine-Tuning لتخصيص نموذج GPT-3.5 أو GPT-4 عبر OpenAI API أو مكتبة Hugging Face، مع OpenAI حول البيانات إلى تنسيق JSONL وابدأ التدريب باستخدام واجهة CLI، أما مع Hugging Face قم بتحميل نموذج مسبق التدريب مثل GPT-2، وجهز بياناتك باستخدام مكتبة datasets، ثم استخدم Trainer لتدريب النموذج محليا، و بعد التدريب استخدم النموذج للرد على المستخدم وفقا للتصنيفات، وأيضا لتوفير الموارد اختر نماذج أصغر أو قلل حجم البيانات أثناء التدريب، وقيم أداء النموذج باستخدام مجموعة اختبار لتحسين النتائج.

حسنًا ولكن للتدريب على GPT يوجد خطط كثيرة 
ماهو الأنسب لما ذكرت من مقدار البيانات واللآلية التي وضحتها 
فقد تهت بين الخطط ولم استوعب معناها 
إن امكن توضيح خطط الاشتراك لي والانسب منها لهذه المهام 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...