Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: mysql - nic nie robi a zyżywa 50% cpu
Forum PHP.pl > Forum > Bazy danych > MySQL
skleps
Jest serwer postawiony na vps.

Od piątku coś dziwnego się dzieje, ponieważ top pokazuje, że proces mysqld zużywa od 40% do 70% cpu, ale mtop pokazuje tylko zwykle pojedyncze zapytania, lub wręcz tylko "show processes".

Serwer w wersji z lenny'ego, czyli bodajże 5.0.51a?
Hekko
mtop dość rzadko odświeża, co tam jeszcze działa? Spory ruch na WWW?
skleps
W międzyczasie poszukaliśmy i okazało się, że toto bydło nas odwiedzało i ostro trzepało:

http://discoveryengine.com/discobot.html

NA razie dostało bana na jedno IP, a jak się powtórzy to dostanie na cala klasę.

Tak przy okazji - można zrobić bana ip w .htaccess na cześć klasy?
abort
Wszyscy by tylko banowali. A na stronie dokumentacji, którą podałeś. wisi jak byk, że wystarczy wykorzystać plik "robots.txt".
I problem powinieneś mieć z głowy:

Kod
How can I stop your crawler from visiting my website?
If you would like our crawler to stop visiting your site, please add the following lines to your robots.txt file:

    User-agent: discobot
    Disallow: /
thek
A co za różnica czy dasz disallow po stronie robots czy już na etapie htaccess? smile.gif Ja roboty także w serwisach wycinam poprzez htaccess czy to poprzez IP czy regexpa na różnych danych, takich jak choćby UA. Pozostaje więc jedynie kwestia wydajności... Wycinanie ruchu którym rozwiązaniem jest szybsze. Tego akurat nigdy nie sprawdzałem, ale a nuż gdzieś jakies testy były smile.gif
skleps
Cytat(abort @ 19.12.2011, 13:14:18 ) *
Wszyscy by tylko banowali. A na stronie dokumentacji, którą podałeś. wisi jak byk, że wystarczy wykorzystać plik "robots.txt".
I problem powinieneś mieć z głowy:

Kod
How can I stop your crawler from visiting my website?
If you would like our crawler to stop visiting your site, please add the following lines to your robots.txt file:

    User-agent: discobot
    Disallow: /



No ale nie był, bot totalnie olał sobie wpis do robots.txt, dopiero wycięcie IP w .htaccess pomogło
erix
Bo podejrzewam, że robots.txt jest odczytywany na starcie indeksowania.
skleps
Cytat(erix @ 19.12.2011, 23:12:06 ) *
Bo podejrzewam, że robots.txt jest odczytywany na starcie indeksowania.


Też tak sądzę - ale mógłby z raz na dobę sobie to refreszować, teraz za to ma bana po IP i jest spokój.
Jakoś boty googla, twengi czy innych takich potrafią "czytać" serwis "po bożemu"
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.