The Night Shadow
18.12.2008, 20:51:01
Wyszukiwarka google potrafi prezentować wersję HTML plików doc. Moje pytanie, czy istnieje możliwość odczytania zawartości pliku DOC z poziomu PHP ewentualnie przekonwertowanie pliku DOC do PDF lub HTML?
UWAGA! Pytanie NIE odnosi się do serwera Windows z zainstalowanym Officem i dostępem przez funkcje COM i API office'a lub open office'a. Chodzi mo o czysty PHP na tej samej zasadzie, na której generujemy pliki PDF w PHP.
Czy to jest w ogóle możliwe? Chodzi mi o przeszukiwanie treści plików. Potrafię odczytać i generować pliki Excela, PDF, TXT, do kompletu brakuje tylko DOC.
Pilsener
18.12.2008, 23:33:09
Mi też brakuje .doc - każdemu się wydaje, że wygenerować np. prezentację w ppt to bułka z masłem - kiedyś intensywnie szukałem odpowiednich rozwiązań, jednak nic nie znalazłem, zresztą nic dziwnego, bo rozwiązania takie są mało praktyczne - .doc to żaden standard.
The Night Shadow
19.12.2008, 00:22:01
No tak, może i żaden standard jednakże większość osób korzysta właśnie z tego formatu jeśli chodzi o przechowywanie tekstu. Interesujące jest jednak to, że powstały klasy dla Excela, a Worda niestety nie ma. Gdyby to wszystko zostało ujednolicone możnaby tworzyć naprawdę niezwykle zaawansowane systemu zarządzania danymi, a w aktualnej sytuacji nie istnieje na przykład możliwość przeszukiwania zawartości dokumenów typu doc. O ile PDF, Excel, txt, rtf, csv, xml i inne pochodne formaty dają się analizować o tyle doc jest tu jakby wyjątkiem... nie znam jego struktury od strony sposbu kodowania i zapisu danych, ale mam wrażenie, że jest na tyle strzeżona lub na tyle źle opisana (niby MS oddał specyfikację doc już spory kawałek czasu temu), że nikt nie zrobił porządnej klasy do jego obsługi. Szkoda...
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę
kliknij tutaj.