• 0

هل هناك أدوات لاستخراج النصوص من ملفات pdf العربية المصورة؟

أعرف الكثير من أدوات استخراج النصوص من ملفات pdf الإنكليزية، أو العربية والتي يكون أصلها في الأساس مستند وورد.

لكن ما أبحث عنه أداة تستخرج النص العربي من ملف pdf أساسه صور jpg. فما هي تجاربكم في ذلك؟

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة
  • 0

قرأتُ في الوِب عن أداة تُدعى tesseract-ocr تعمل على استخراج النصوص من الصور، لكن ووفق تجربتي لها فدعمها للعربيّة سيء.
آخر ما قمتُ بتجربته وأثبت جدارته إلى حد مقبول، هو الخدمة الجديدة التي تُقدمها Google Drive، فيمكنك ببساطة رفع الصورة إلى حسابك في درايف ثم النقر عليها بزر اليمين واختيار: فتح بواسطة > مستندات Google.
للاستفادة من هذه الميزة حوّل ملف الـ PDF إلى صور واستخدم غوغل درايف.
هذه أفضل الحلول إلى الآن حسب تجربتي المتواضعة.

انشر على الشّبكات الاجتماعية


رابط هذه المساهمة

يجب أن تكون عضوًا لدينا لتتمكّن من التعليق

انشاء حساب جديد

يستغرق التسجيل بضع ثوان فقط


سجّل حسابًا جديدًا

تسجيل الدخول

تملك حسابا مسجّلا بالفعل؟


سجّل دخولك الآن