tomkoz
24.05.2005, 07:04:20
Szukam informacji o możliwości dynamicznego przeszukiwania dokumentów pfd. Czy ktoś sie tym zajmował? Może jakieś skrypty.
pozdrawiam
SongoQ
24.05.2005, 08:55:56
Chesz przeszukiwac po tekscie pdfa?
Wydaje mi sie lepsze rozwiazanie tekst zapisania w bazie i szukania po bazie a dopiero odwolania sie do pdfa.
tomkoz
24.05.2005, 10:26:48
Szukalbym takiego skryptu który wyszukiwałby w pdf danego słowa, nie ma sensu zgrywać cały dokument do bazy, tym bardziej ze pdf sa uploadowane.
Taki skrypt powinien gdzies byc (np. google wyszukuje w pdf), skoro udaje sie dynamiczni wygenerowac dokument to powinno dac rade go przetworzyć.
orson
24.05.2005, 17:50:36
witam ...
hmm ... na tej stronie pisze jak można wyszukaiwać w plikach pdf przy pomocy grepa ... więc może będzie się dało w linuxie
http://www.accesspdf.com/article.php/20041222155709745a tu jest commandlinowy extractor do pdf ...
http://www.snapfiles.com/get/pdftotext.html wyciągasz text, wsadzasz do bazy i tam robisz search na żądanie ... na stronie xpdf jest info o nim też ...
pozdrawiam
SongoQ
24.05.2005, 19:42:19
Ja bym sie dalej tego trzymal ze w chwili ladowania na serwer ladujesz do bazy i potem przeszukiwanie. Jakos nie wyobrazam sobie szukac po np milionach plikow.
Zobacz jak dziala google.