لماذا استخراج الجداول من PDF صعب؟
PDF لا يخزّن "جداول" كبنية بيانات — بل يخزّن نصوصاً في مواضع محددة. البرنامج يحاول تحديد الجدول من خلال موضع النص والمسافات والخطوط. هذا ما يجعله أحياناً غير دقيق.
نوعان من جداول PDF
جداول برمجية: أُنشئت من Excel أو Word. التحويل دقيق جداً.
جداول مصورة: من ملف ممسوح ضوئياً. تحتاج OCR أولاً وقد لا تكون النتيجة مثالية.
خطوات التحويل
- افتح arabpdf.net/pdf-to-excel
- ارفع ملف PDF الذي يحتوي الجداول
- انتظر المعالجة
- حمّل ملف Excel وتحقق من البيانات
مشاكل شائعة وحلولها
بيانات مدموجة في خلية واحدة: استخدم Text to Columns في Excel لفصلها.
الأرقام كنص: حددها وغيّر تنسيق الخلية إلى "رقم" أو "عملة".
صفوف مفقودة: قد يكون PDF يستخدم خطوطاً ملوّنة بدل الحدود. جرّب تحسين جودة PDF أولاً.
نصيحة للجداول الكبيرة
إذا كان PDF يحتوي على جداول كبيرة ممتدة على عدة صفحات، تحقق من أن رؤوس الأعمدة تكررت بشكل صحيح في ملف Excel. قد تحتاج لتنظيف يدوي للصفوف الأولى من كل صفحة.