AHMED_IT

زيزوومى مميز
إنضم
19 مارس 2008
المشاركات
520
مستوى التفاعل
302
النقاط
570
الإقامة
EGYPT
متصل
سؤالي عند البحث في ملف pdf به نصوص عربية بعض الملفات يستجيب و يعطي نتائج بحث و الاخر لا يستجيب هل أحد عنده حل لهذه المشكلة أو تفسير لها ؟
ملحوظة :
لا اقصد ملفات اصلها صور بل اصلها ملفات وورد
 

توقيع : AHMED_IT
السَلام عليكم ورحمة الله وبركاته
التفسير ببساطة شديدة
أن الموضوع بيعتمد على حسب الطريقة التي تم تحويل بها ملف الword إلى PDF
وبتعتمد على لغة النص كمان
ففي حالة اللغة الإنجليزية
ستكون برامج عرض الPDF بما في ذالك متصفحات الويب قادرة على تحليل النص وعرضه والبحث فيه
بينما مع اللغة العربية ستكون أقل بكثير
وسيعتمد الأمر على دقة الملف وهل يحتوي تشكيل أو لا ونوع الخط وحجمه وغيرها من العوامل
لأن صيغة PDF صيغة جامدة في أصلها ولا يمكن التعامل معها دون تحليل النص واستخراجه منها
بشكل لحظي كما تفعل المتصفحات والبرامج
أو عن طريق التحويل الفعلي إلى صيغة نصية MD, TXT, DOC ETC.
 
توقيع : MesterPerfectMesterPerfect is verified member.
وللتفصيل أكثر
يعتمد البحث داخل ملفات PDF التي تحتوي على نصوص عربية على الطريقة التي تم بها تحويل ملف الـ Word إلى PDF، بالإضافة إلى بعض العوامل التقنية المتعلقة باللغة العربية.

أسباب المشكلة:

  1. طريقة التحويل: بعض الطرق تحتفظ بالنصوص كمحتوى قابل للبحث، بينما تقوم طرق أخرى بتحويل النصوص إلى كائنات رسومية غير قابلة للبحث.
  2. ترميز النصوص: بعض برامج تحويل Word إلى PDF لا تحافظ بشكل صحيح على ترميز النصوص العربية، مما يؤدي إلى عدم قدرة برامج عرض PDF على قراءتها أو البحث فيها.
  3. خطوط الكتابة: بعض أنواع الخطوط العربية قد تؤدي إلى تشفير النصوص داخل ملف PDF بطريقة تعيق البحث فيها.
  4. التشكيل وعلامات الترقيم: وجود التشكيل قد يؤثر على دقة نتائج البحث، حيث يمكن أن تختلف الطريقة التي يخزن بها النص المشكّل داخل ملف PDF.
  5. طريقة التخزين داخل PDF: أحيانًا يتم تضمين النصوص العربية داخل الـ PDF باستخدام طبقات معقدة (Layered Text)، مما قد يعيق برامج القراءة من التعرف عليها عند البحث.

الحلول المقترحة:

  1. تجربة فتح الملف ببرنامج مختلف مثل Adobe Acrobat Reader أو Foxit Reader، حيث إن بعض البرامج تدعم البحث في النصوص العربية بشكل أفضل.
  2. إعادة تحويل ملف Word إلى PDFباستخدام طريقة مختلفة، مثل:
    • استخدام ميزة "حفظ باسم PDF" داخل Microsoft Word.
    • تجنب استخدام طابعات PDF الافتراضية التي قد تحول النصوص إلى صور غير قابلة للبحث.
  3. استخراج النص يدويًا باستخدام أدوات OCR (التعرف البصري على النصوص) إذا كان الملف لا يدعم البحث.
  4. تحويل PDF إلى صيغة نصية مثل TXT أو DOC باستخدام برامج أو خدمات أونلاين، ثم البحث داخل الملف الناتج.
  5. التحقق من الخطوط المستخدمة في ملف Word قبل التحويل، ويفضل استخدام الخطوط القياسية مثل Traditional Arabic أو Arial.
الخلاصة:
إذا كان ملف PDF يسمح بالبحث في النصوص الإنجليزية ولكن ليس في العربية، فالمشكلة غالبًا تتعلق بطريقة تحويل النصوص وترميزها داخل PDF، لذا يُفضَّل تجربة طرق مختلفة للتحويل والتحقق من إعدادات الخطوط والترميز.
 
توقيع : MesterPerfectMesterPerfect is verified member.
عودة
أعلى