تحويل ل pdf الى ملف json

28 ديسمبر 2025

مرحبا عندي استفسار اني اعمل على مشروع اختبارات ولدي الاسئلة التي اريد ان ادخلها الى قاعدة البيانات على شكل صور ما هي الطريقة المثلى لتحويل هذه الملفات الى json بحيث تستخلص الاسئلة والاجوبة بدلا من اعادة كتابتها يدويا لان هذا سياخذ مني وقتا طويلا

28 ديسمبر 2025

حاول أولًا تحليل طبيعة الملفات لديك. هل ملفات الـ PDF عبارة عن صور ممسوحة ضوئيًا فقط، أم تحتوي نصًا قابلًا للتحديد والنسخ؟ هذه نقطة مهمة جدًا لأنها تحدد المسار المناسب.

إذا كانت الملفات صورًا، يمكنك البحث عن مفهوم OCR (التعرّف الضوئي على الحروف)، ومحاولة تجربة أدوات تقوم بتحويل الصور إلى نص. بعد الحصول على النص، حاول التفكير في كيفية تنظيمه: هل الأسئلة مرقمة؟ هل الخيارات لها نمط ثابت؟ هذا سيساعدك لاحقًا في تحويل النص إلى بنية JSON.

أما إذا كان الـ PDF نصيًا، فيمكنك استكشاف مكتبات قراءة PDF واستخراج النص مباشرة، ثم كتابة منطق بسيط يفصل السؤال عن الإجابة.

28 ديسمبر 2025

ستحتاج إلى إستخدام نماذج للذكاء الإصطناعي لتستطيع تحويل الصور إلى نصوص ومن ثم تحويل النصوص هذه إلى أى صيغة تريدها .

وأيضا قد تجد مواقع تقوم بتوفير API لك لهذا الأمر حيث ليس عليك إنشاء النموذج من البداية بنفسك ولكن هذا الأمر سيكون مكلفا وستقوم بدفع الأموال مقابل إستخدام تلك ال APIS .

أما إذا كان الملف هو عبارة عن PDF وليس صورة فيمكنك حينها إستخدام مكتبات لتحويل وإستخراج النصوص من ملف PDF والأفضل إستعمال لغة بايثون في هذا الأمر فهي تحوي مكتبات قوية ستفيدك كثيرا .

29 ديسمبر 2025

فكرتك منطقية جدًا، ولا أحد يعيد كتابة هذا العدد من الأسئلة يدويًا إذا كان هناك حل عملي.

الطريقة المثلى في حالتك تعتمد على خطوة أساسية وهي تحويل الصور إلى نص أولًا، ثم تنظيم هذا النص وتحويله إلى JSON. لا توجد طريقة مباشرة تقفز من صورة إلى JSON بدون المرور بمرحلة استخراج النص.

أول ما تحتاجه هو استخدام تقنية OCR، وهي المسؤولة عن قراءة النص الموجود داخل الصور. هذه التقنية تقوم بتحويل الصورة إلى نص عادي يمكنك التعامل معه برمجيًا. جودة النتيجة تعتمد كثيرًا على وضوح الصور، نوع الخط، وهل النص عربي أم إنجليزي. إذا كانت الصور واضحة والأسئلة مكتوبة بخط مطبوع فالناتج غالبًا سيكون جيدًا.

بعد أن تحصل على النص، ستجد أن الأسئلة والأجوبة أصبحت مجرد نص متتابع. هنا يأتي دورك في تنظيمه. غالبًا الأسئلة تكون بنمط متكرر مثل: سؤال ثم عدة اختيارات أو إجابة صحيحة. يمكنك كتابة سكربت بسيط بلغة مثل Python يقرأ النص ويقسمه بناءً على هذا النمط، ثم يحوله إلى كائنات JSON تحتوي على السؤال، الاختيارات، والإجابة الصحيحة.

مثلًا، كل سؤال يصبح عنصرًا واحدًا داخل مصفوفة، وداخله نص السؤال، قائمة الإجابات، وتحديد الإجابة الصحيحة. هذه المرحلة تحتاج بعض التعديل اليدوي في البداية، لكن بعد ضبط القواعد، يمكن معالجة مئات الأسئلة دفعة واحدة.

لو أردت تقليل الجهد أكثر، يمكنك استخدام أدوات OCR تدعم العربية بشكل جيد، ثم تمرير النص الناتج إلى سكربت يعيد ترتيبه. بعض الناس يراجعون النتائج سريعًا بعد التحويل بدل الكتابة من الصفر، وهذا يوفر وقتًا كبيرًا.

الخلاصة أن الحل الأفضل ليس تحويل الصور مباشرة إلى JSON، بل بناء مسار منطقي: صورة ثم نص، ثم تنظيم النص، ثم JSON. في البداية ستأخذ منك بعض الوقت لضبط العملية، لكن بعد ذلك ستوفر عليك ساعات طويلة من العمل اليدوي.

29 ديسمبر 2025

أفضل وأسرع طريقة في الوقت الحالي هي استخدام الذكاء الاصطناعي متعدد الوسائط Multimodal AI، لأنها لا تقوم فقط باستخراج النص OCR، بل تفهم سياق الصورة، أي أنها تدرك أين يقع السؤال، وأين توجد الخيارات، وما هو الإجابة الصحيحة، وتقوم بتنسيقها لك كملف JSON جاهز.

ستقومين بكتابة سكريبت بسيط لأتمتة العملية بالكامل.

لكن الأمر مدفوع بالطبع وليس مجاني، يمكنك تجربة Vision API من Google Cloud Platform وهي تقنية التعرف الضوئي على الحروف (OCR)، والتي تدعم اللغة العربية، وتوفر جوجل تجربة مجانية عندما تقوم بالتسجيل لأول مرة، حيث ستحصل على بعض الرصيد لاستخدامه.

لو أردتِ إتمام الأمر بشكل مجاني، ستجدي تفصيل هنا:

تحويل ل pdf الى ملف json

السؤال

Aya Zartit

4 أجوبة على هذا السؤال

Recommended Posts

Abdulrahman Muhammad

محمد عاطف25

Sherif Aboghazala

Mustafa Suleiman

انضم إلى النقاش

إعلانات

تابعنا على

الرئيسية

كيف أتعلم؟

تابعنا

دروس ومقالات

أسئلة وأجوبة

كتب

دورات

بطاقات هدية