Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Robot czytający ze stron
Forum PHP.pl > Inne > Hydepark
mrc
Cześć,

Czy pisząc robota masowo czytającego ze stron powinienem zwrócić na coś szczególnie uwagę? Chodzi mi np. o ilość requestów na minutę itp, aby strony nie blokowały mi adresu ip (aby nikt nie pomyślał że próbuję atakować stronę itp).
kayman
widzisz -> przez to że walczę z tym na co dzień podawanie info jak go dobrze napisać było by strzałem w stopę, jednak nie jest to wiedza tajemna i wystarczy chwilę pomyśleć by nie był blokowany przynajmniej na początku
Spawnm
Takie coś jest legalne?
kayman
legalne -> np roboty wyszukiwarek działają w ten sposób

koodo218
Ciekawy artykuł dotyczący tematu:
https://wprawoautorskie.wordpress.com/2014/...ler-roboty-txt/
kayman
Cytat
Wydaje się, że podstawową sprawą jest rozróżnienie samej czynności crawlowania (automatycznego przeszukiwania treści stron internetowych, indeksowania jej i pobierania) od ewentualnego późniejszego wykorzystywania pozyskanych w ten sposób treści.


i to jest kluczowa kwestia własnie -> do czego posłużą dane pobrane dane, czy pobieranie będzie korzystne dla wydawcy strony etc.

dodam jeszcze że natarczywe roboty powodują czasami niemałe obciążenie serwera więc lepiej takie poinformować że strona o podanym adresie nie istnieje smile.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.