Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Robot wyszukujący keywords'y
Forum PHP.pl > Forum > PHP
Przem4S
Mianowicie usiłuję napisać robota, który za zadanie będzie miał wyszukiwanie i zapisanie keyword'sów do pliku.
Zasada działania:
1. Robot indeksuje stronę przykladowo wchodzi na link w strefie danej domeny, lub subdomeny. Pozwala także dodać podstrony które ma omijać.
2. Pobiera zawartość danej podstrony, czyści tagi html, zlicza słowa i zapisuje słowa np. występujące częśniej niż 3 razy (przykład).
3. Zapisuje dane do pliku w katalogu takim samym jak dany link.

O tyle o ile nie mam problemu ze zliczeniem słów i ich zapisem, to mam problem z indexowaniem witryny, nie wiem jak wgl się za to zabrać.
W jaki sposób robot ma znajdować podstrony w danej subdomenie, tutaj brakuje mi pomysłu.
krzywy36
wchodzisz na powiedzmy stronę główną, i wychwytujesz wszystkie linki jakie na niej są, wywalasz te nienależące do domeny i po kolei wchodzisz na nie itd itd, przy okazji zapisujesz gdzieś odwiedzone żeby nie powtarzać.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.