Forum PHP.pl > Robot czytający ze stron

Pomoc - Szukaj - Użytkownicy - Kalendarz

mrc

28.02.2016, 08:15:56

Cześć,

Czy pisząc robota masowo czytającego ze stron powinienem zwrócić na coś szczególnie uwagę? Chodzi mi np. o ilość requestów na minutę itp, aby strony nie blokowały mi adresu ip (aby nikt nie pomyślał że próbuję atakować stronę itp).

kayman

28.02.2016, 13:34:19

widzisz -> przez to że walczę z tym na co dzień podawanie info jak go dobrze napisać było by strzałem w stopę, jednak nie jest to wiedza tajemna i wystarczy chwilę pomyśleć by nie był blokowany przynajmniej na początku

Spawnm

28.02.2016, 14:01:20

Takie coś jest legalne?

kayman

28.02.2016, 14:20:27

legalne -> np roboty wyszukiwarek działają w ten sposób

koodo218

28.02.2016, 15:45:31

Ciekawy artykuł dotyczący tematu:
https://wprawoautorskie.wordpress.com/2014/...ler-roboty-txt/

kayman

28.02.2016, 17:42:36

Cytat

Wydaje się, że podstawową sprawą jest rozróżnienie samej czynności crawlowania (automatycznego przeszukiwania treści stron internetowych, indeksowania jej i pobierania) od ewentualnego późniejszego wykorzystywania pozyskanych w ten sposób treści.

i to jest kluczowa kwestia własnie -> do czego posłużą dane pobrane dane, czy pobieranie będzie korzystne dla wydawcy strony etc.

dodam jeszcze że natarczywe roboty powodują czasami niemałe obciążenie serwera więc lepiej takie poinformować że strona o podanym adresie nie istnieje

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.