Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: wyciągnięcie danych z plików pdf i obliczenia na nich
Forum PHP.pl > Forum > PHP
milons
Witam.

Mam pytanie.
Zostałem poproszony o wykonanie aplikacji która wykona drobne obliczenia magazynowe.
Ze względów praktycznych wybrałem język PHP, z resztą w tym języku potrafię najwięcej.

Przechodząc do konkretów:
Program księgujący drukuje do plików pdf 2 zestawienia:
-przychód magazynowy
-rozchód wewnętrzny

Zadaniem jest stworzenie aplikacji która wczyta te 2 pdf i policzy różnicę między tymi stanami.
W pdf wygląda to w dużym, dużym uproszczeniu tak:

-Seria 1/1: 300kg
-Seria 1/3: 400kg


Możecie mnie naprowadzic jak zabra się za w/w projekt?
Wiem że trzeba:

-wczytac te pliki
-wyciągnąc z nich dane o każdej serii przychodu [np do tablicy o indeksach 1/1 itd] - tutaj jakaś gotowa biblioteka
-sprawdzic czy istnieje rozchód dla tej serii i dokonac obliczen
-sprawdzic czy istenieje rozchód bez przychodu [czasami może się zdarzyc ze ktoś nie wprowadzi przychodu i wypisany jest rozchód - trzeba to wyszczególnic]
-wyswietlic te dane [odpowiednio zaznaczone które się zgadzają, gdzie nie ma przychodu, gdzie nie ma rozchodu i ile ew. zostało danego przedmiotu]
-ewentualnie zrobic z tego zestawienie do pliku pdf.

Możecie naprowadzi mnie w jaki sposób zabrac się za zadanie?
Z jakimi bibliotekami/funkcjami się zapoznac?
mstraczkowski
Wydaje mi się że założenie, aby wyciągać informacje z PDF jest złe.
Upewnij się że nie masz innego wyjścia (czy przykładowo nie możesz otrzymać tych raportów w CSV lub XML)


Dokumenty PDF nie zawierają w sobie bezpośrednio zawartości, którą możemy odczytać jak np w pliku *.txt
Czytanie z PDF to mordęga i przerost formy nad treścią, osobiście nigdy nie byłem zmuszony do takich herezji.
Ale jeżeli musiałbym i nie miałbym innego wyboru to poszperałbym w google pod frazami: php pdf reader
Udało mi się znaleźć coś takiego, być może ci pomoże: http://webcheatsheet.com/php/reading_clean_text_from_pdf.php
skowron-line
Zapoznaj się z tym programem księgowym może trzyma dane w jakieść bazie, a to już wielki krok w przód.
Co do odczytu danych z pdf-a to jak kolega wyżej napisać droga przez męke, możesz też skorzystać w JAVY z tego co kojaże to iTEXT ma możliwość odczytu pliku pdf i nie jest to jakoś szczególnie skomplikowane (pod warunkiem że nie jest to skan).
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.