gwiktor
15.01.2011, 16:47:54
Witam!
mam pewną stronę która w nagłówku ma
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
to jest xml czy xhtml?
próbuję pobrać źródło tej strony za pomocą
$d = file_get_contents(" link do strony ");
echo htmlspecialchars ($d);
ale nie pobiera mi całej zawartości, co można podejrzeć ręcznie klikając na podgląd strony.
Czemu tak się dzieje i co zrobić żeby pobrać całe źródło strony ?
wookieb
15.01.2011, 17:33:35
Podaj adres strony.
Z nagłówka wynika, że to xhtml
gwiktor
15.01.2011, 17:56:32
przeczytamwszystkich.pl
znalazłem taką komendę która wyświetla źródło strony w przeglądarce
view-source:http://przeczytamwszystkich.pl
ale chciałbym to źródło mieć pobrane do zmiennej $d
wookieb
15.01.2011, 18:03:09
Możliwe, że mają pewne zabezpieczenia. Ale generalnie większość części strony pobierzesz.
gwiktor
15.01.2011, 18:11:34
Ale mi właśnie chodzi o tą część której nie pobieram
chciałem pobrać źródło strony i wydobyć z niej linki
a ta część akurat się nie pobiera
A nie ma innej metody? nie da się użyć view-source w kodzie a nie tylko w oknie przedlądarki ?
jak wrzucę link
<a href="view-source:http://przeczytamwszystkich.pl"> bbb </a>
pokazuje mi źródło strony w zakładce :|
wookieb
15.01.2011, 18:12:38
Które linki chcesz pobrać?
gwiktor
15.01.2011, 18:23:30
Chyba domyślam się w czym problem
Wylogowałem się ze strony i całkiem mozliwe że pobierało mi się źródło strony która się pojawia użytkownikowi nie zalogowanemu.
Jak się domyślam pobieram źródło strony z serwera, tylko myślałem że pobierze źródło strony kiedy jestem zalogowany, łącznie z linkami widocznymi po zalogowaniu.
Tak się zastanawiam skoro jestem zalogowany i napisałem skrypt który działa na przeglądarce to czemu nie pobiera mi strony po zalogowaniu?
Może rozwiązaniem było by pobranie źródła strony z załadowanej zakładki?
Nie wiem już w czym tkwi problem:|
wookieb
15.01.2011, 18:32:10
Dopiero teraz zauważyłem o czym jest ta strona. Myślę, że darujemy sobie dalsze rozważanie tematu.
http://przeczytamwszystkich.pl/regulaminZabraniają używania jakichkolwiek botów.
Spawnm
15.01.2011, 18:38:44
Jak zabraniają to temat zamykamy
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę
kliknij tutaj.