Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Kopiowanie treści strony do .txt / .doc
Forum PHP.pl > Forum > Gotowe rozwiązania > Szukam
Time
Witam.

Nie jestem pewien, czy odpowiedni dział... Ale wydał mi się najodpowiedniejszy.


Otóż jest taka sytuacja:

Moja ciotka, mieszkająca od paru lat we Włoszech, prowadzi bloga turystycznego (w języku włoskim). Teraz, chciałaby stworzyć także wersję polską.
Ale... Ma dostęp do zaplecza bloga włoskiego, dodaje, edytuje wpisy... Blog nie stoi na na żadnym gotowym CMSie a programista nie pomyślał o funkcji eksportu bazy danych z poziomu PA.

Z programistą ciotka nie ma kontaktu, a ja zostałem poproszony o przygotowanie artykułów do tłumaczenia - czyli skopiować do .txt lub .doc zachowując drzewo kategorii.

Dodam, że wpisów jest ok. 1000 przeciętnie po 500-1000 znaków, 6 głównych kategorii a w każdej po 5-8 podkategorii. Dlatego chciałbym uniknąć sposobu: CTRL+C, CTRL+V, bo przy takiej ilości wpisów zajęłoby mi to dwanaście ruskich miesięcy.

Przeszperałem google, znalazłem jakiś sposób z wykorzystaniem Microsoft Visual Basic ale jest zbyt powolny, może 2x szybszy od CTRL+C, CTRL+V.
Następnie znalazłem program WebHTTrack - ale kopiuje po prostu pliki z serwera na dysk.

Zrezygnowany piszę więc z prośbą o pomoc. Czy ktoś z użytkowników tego forum ma na to jakiś patent?


Z góry dziękuję za pomoc.

Pozdrawiam.
artuross
To drzewo kategorii tworzylyby foldery?
Zastosuj cURL, tylko myk jest w tym, ze musisz miec linki do tych artykulow, aczkolwiek jesli znajduja sie one a blogu ogolnodostepne to nie bedzie z tym zadnego problemu.
PrinceOfPersia
potrzebujesz czegoś co się nazywa crawler, albo parser*:
http://google.pl/search?q=web+crawler+php+parser

*nie są to synonimy, ale tego bym szukał w google.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2024 Invision Power Services, Inc.