اذهب إلى المحتوى

السؤال

نشر

لدي مشروع جميل، فكرته أن المستخدم يرسل رابط لفيديو طويل من اليوتيوب أو يحمل فيديو بنفسه والبرنامج يحول ذلك لنص متكامل بدون أية أخطاء إملائية ويحرر النص المستخرج إذا أراد المستخدم

المشروع مبني على عدد من تطبيقات الذكاء الإصطناعي الحديث وبنفسه يقارن النتائج ويختار النص الأفضل لكي يعطي أفضل نتيجة وذالك كان طلب من العميل. أثناء التطبيق أدركت أن ال AI الذي يحول الصوت إلى النص ليس لديه قدرة كافية للصوتيات الطويلة لذا قررت أن التطبيق بنفسه يقطع الصوت لأجزاء صغيرة ويحول كل جزء لنص.

 الذكاء الإصطناعي يتقطع في كثير من الأحيان وخصوصا إذا تم إرسال الصوتيات الكثيرة وراء بعض

أريد أن التطبيق يرسل كل ما يفعله كقطعات لأجل تجربة مستخدم أجمل وأمتع وأيضا لأن لا يضيع كل شيء إذا حصل مشكلة ما أثناء التنفيذ و لأن لا يبدأ المستخدم تحويل ذالك الصوت من جديد من البداية

١. جاري التحميل من الوتيوب والقطع.

٢. تم قطع الصوت ل ١٠ قطعات

٣. جاري تحويل القطعة ١

٤. ها هو القطعة ١

٥. جاري تحويل القطعة ٢

الخ

وأيضا التطبيق يجب عليه الإشتغال حتى إذا أغلقه المستخدم لأن الفيديو المحول طويل جدا والعملية تأخذ وقت كبيييير جدا.

ما هو السبيل الأحسن لفعل ذلك؟ هل استخدم ال websockets في هذه الحالة أم  ال Server-Sent Events (SSE) ؟

 

Recommended Posts

لا توجد أي إجابات على هذا السؤال بعد

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...