Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [inne][HTML] monitoring strony w wyszukiwarce
Forum PHP.pl > Forum > Przedszkole
Gość
Witam

od czego moze zalezec to ze kod ktory zwraca wyszukiwarka google w wynikach wyszukiwania jest rozny
ponizej przyklady

kod otrzymany po wejsciu na strone przez przegladarke
Kod
<a onmousedown="return rwt(this,'','','','12','AFQjCNG02UMinZyXat6nyo0lwTEyf2VanA','','0CDoQFjABOAo','','',event)" class="l" href="http://www.mapa-europy.com/">Satelitarna <em>Mapa Europy</em></a>



kod otrzymany po wejsciu na strone przez curl
Kod
<a href="/url?q=http://www.mapa-europy.com/&amp;sa=U&amp;ei=_q3gUMaFNNKzhAeLsYHIBQ&amp;ved=0CB0QFjAAOAo&amp;usg=AFQjCNEqUtMdTWsFNwqC4oIiw-bYiPES9A">Satelitarna <b>Mapa Europy</b></a>


chodzi o to ze w href jest inny zapis oraz brak jest class="l" w znaczniku <a> w przypadku gdy wchodze na strone przez curl

w obu przypadkach stosuje ten sam user agent

jaslanin
pewnie google wykrywa że curl nie obsługuje js, i serwuje inną wersje
Gość
no wlasnie w tym problem ze czasami zdarza sie ze przy pobieraniu przez curl jest zarowno wersja 1 jak i wesja 2

teraz sprawdzalem ze przy wejsciu przez curl (nie wykorzystuje tu proxy) serwuje mi wersje 1

natomiast przy wejsciu przez curl z wykorzystaniem proxy serwuje mi wersje 2

w obu przypadkach nie dziala js, a pobrany kod zrodlowy jest inny

wiec musi byc jeszcze jakis inny czynnik ktory na to wpływa

ma ktos może jakiś pomysł ?

jaslanin
proxy może dodawać swoje nagłówki, które sugerują google że js jest obsługiwany.
Gość
ciagnac temat dalej
podczas pobierania strony przez curl (zarowno przez proxy jak i bez proxy) ustawiam takie same naglowki
wiec to chyba tez nie to
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.