Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: dane z PDF do PHP
Forum PHP.pl > Forum > Gotowe rozwiązania
smiady
Witam.

Chce wydobyć z PDFa tekst w PHPie. PDFy są generowane z worda, ale niestety wyskakują mi krzaki np. T?questionmark.gifi??W?questionmark.gif

  1. include 'pdf2text.php';
  2.  
  3. $pdf= new PDF2Text;
  4.  
  5. $pdf->setFilename('pdf_z_worda.pdf');
  6. $pdf->decodePDF();
  7.  
  8. echo $pdf->output();


Niektóre pdfy są ok odczyta, ale te z worda już nie.

Korzystam z klasy http://www.phpclasses.org/browse/file/31030.html,
ale też korzystałem z http://www.pdfparser.org/ co też krzaczy.
Jest wiele klas podobnych do pdf2text, gdzie wszystkie wyłowują ten sam efekt ...
markuz
Jeżeli masz serwer na linux`ie to możesz użyć pdftohtml, a następnie scrapować html`a wynikowego. Krótszej drogi nie znam ale może ktoś inny zna wink.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.