اذهب إلى المحتوى

السؤال

نشر

مرحبا عندي استفسار اني اعمل على مشروع اختبارات ولدي الاسئلة التي اريد ان ادخلها الى قاعدة البيانات على شكل صور ما هي الطريقة المثلى لتحويل هذه الملفات الى json بحيث تستخلص الاسئلة والاجوبة بدلا من اعادة كتابتها يدويا لان هذا سياخذ مني وقتا طويلا 

Recommended Posts

  • 0
نشر

حاول أولًا تحليل طبيعة الملفات لديك. هل ملفات الـ PDF عبارة عن صور ممسوحة ضوئيًا فقط، أم تحتوي نصًا قابلًا للتحديد والنسخ؟ هذه نقطة مهمة جدًا لأنها تحدد المسار المناسب.

إذا كانت الملفات صورًا، يمكنك البحث عن مفهوم OCR (التعرّف الضوئي على الحروف)، ومحاولة تجربة أدوات تقوم بتحويل الصور إلى نص. بعد الحصول على النص، حاول التفكير في كيفية تنظيمه: هل الأسئلة مرقمة؟ هل الخيارات لها نمط ثابت؟ هذا سيساعدك لاحقًا في تحويل النص إلى بنية JSON.

أما إذا كان الـ PDF نصيًا، فيمكنك استكشاف مكتبات قراءة PDF واستخراج النص مباشرة، ثم كتابة منطق بسيط يفصل السؤال عن الإجابة. 

  • 0
نشر

ستحتاج إلى إستخدام نماذج للذكاء الإصطناعي لتستطيع تحويل الصور إلى نصوص ومن ثم تحويل النصوص هذه إلى أى صيغة تريدها .

وأيضا قد تجد مواقع تقوم بتوفير API لك لهذا الأمر حيث ليس عليك إنشاء النموذج من البداية بنفسك ولكن هذا الأمر سيكون مكلفا وستقوم بدفع الأموال مقابل إستخدام تلك ال APIS .

أما إذا كان الملف هو عبارة عن PDF وليس صورة فيمكنك حينها إستخدام مكتبات لتحويل وإستخراج النصوص من ملف PDF والأفضل إستعمال لغة بايثون في هذا الأمر فهي تحوي مكتبات قوية ستفيدك كثيرا .

  • 0
نشر

فكرتك منطقية جدًا، ولا أحد يعيد كتابة هذا العدد من الأسئلة يدويًا إذا كان هناك حل عملي.

الطريقة المثلى في حالتك تعتمد على خطوة أساسية وهي تحويل الصور إلى نص أولًا، ثم تنظيم هذا النص وتحويله إلى JSON. لا توجد طريقة مباشرة تقفز من صورة إلى JSON بدون المرور بمرحلة استخراج النص.

أول ما تحتاجه هو استخدام تقنية OCR، وهي المسؤولة عن قراءة النص الموجود داخل الصور. هذه التقنية تقوم بتحويل الصورة إلى نص عادي يمكنك التعامل معه برمجيًا. جودة النتيجة تعتمد كثيرًا على وضوح الصور، نوع الخط، وهل النص عربي أم إنجليزي. إذا كانت الصور واضحة والأسئلة مكتوبة بخط مطبوع فالناتج غالبًا سيكون جيدًا.

بعد أن تحصل على النص، ستجد أن الأسئلة والأجوبة أصبحت مجرد نص متتابع. هنا يأتي دورك في تنظيمه. غالبًا الأسئلة تكون بنمط متكرر مثل: سؤال ثم عدة اختيارات أو إجابة صحيحة. يمكنك كتابة سكربت بسيط بلغة مثل Python يقرأ النص ويقسمه بناءً على هذا النمط، ثم يحوله إلى كائنات JSON تحتوي على السؤال، الاختيارات، والإجابة الصحيحة.

مثلًا، كل سؤال يصبح عنصرًا واحدًا داخل مصفوفة، وداخله نص السؤال، قائمة الإجابات، وتحديد الإجابة الصحيحة. هذه المرحلة تحتاج بعض التعديل اليدوي في البداية، لكن بعد ضبط القواعد، يمكن معالجة مئات الأسئلة دفعة واحدة.

لو أردت تقليل الجهد أكثر، يمكنك استخدام أدوات OCR تدعم العربية بشكل جيد، ثم تمرير النص الناتج إلى سكربت يعيد ترتيبه. بعض الناس يراجعون النتائج سريعًا بعد التحويل بدل الكتابة من الصفر، وهذا يوفر وقتًا كبيرًا.

الخلاصة أن الحل الأفضل ليس تحويل الصور مباشرة إلى JSON، بل بناء مسار منطقي: صورة ثم نص، ثم تنظيم النص، ثم JSON. في البداية ستأخذ منك بعض الوقت لضبط العملية، لكن بعد ذلك ستوفر عليك ساعات طويلة من العمل اليدوي.

  • 0
نشر

أفضل وأسرع طريقة في الوقت الحالي هي استخدام الذكاء الاصطناعي متعدد الوسائط Multimodal AI، لأنها لا تقوم فقط باستخراج النص OCR، بل تفهم سياق الصورة،  أي أنها تدرك أين يقع السؤال، وأين توجد الخيارات، وما هو الإجابة الصحيحة، وتقوم بتنسيقها لك كملف JSON جاهز.

ستقومين بكتابة سكريبت بسيط لأتمتة العملية بالكامل.

لكن الأمر مدفوع بالطبع وليس مجاني،  يمكنك تجربة Vision API من Google Cloud Platform وهي تقنية التعرف الضوئي على الحروف (OCR)، والتي تدعم اللغة العربية، وتوفر جوجل تجربة مجانية عندما تقوم بالتسجيل لأول مرة، حيث ستحصل على بعض الرصيد لاستخدامه.

لو أردتِ إتمام الأمر بشكل مجاني، ستجدي تفصيل هنا:

 

انضم إلى النقاش

يمكنك أن تنشر الآن وتسجل لاحقًا. إذا كان لديك حساب، فسجل الدخول الآن لتنشر باسم حسابك.

زائر
أجب على هذا السؤال...

×   لقد أضفت محتوى بخط أو تنسيق مختلف.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   جرى استعادة المحتوى السابق..   امسح المحرر

×   You cannot paste images directly. Upload or insert images from URL.

  • إعلانات

  • تابعنا على



×
×
  • أضف...