Forum PHP.pl > [PHP] cURL i POST raz jeszcze

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP] cURL i POST raz jeszcze

seph84

9.07.2008, 15:46:53

Witam!

Zaczynam zabawę z cURL'em i jak to bywa na początku, nadziałem się na kilka problemów. Pierwszą rzeczą, jaką chcę opanować, to zasysanie wybranego przeze mnie contentu z serwisów. Dla przykładu znalazłem gotowca wypytującego Amazon o książki o tematyce PHP i MYSQL:

Kod

<?php
$url = "http://www.amazon.com/exec/obidos/search-handle-form/002-5640957-2809605";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_FAILONERROR, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_TIMEOUT, 3);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, "url=index%3Dbooks&field-keywords=PHP+MYSQL");
$result = curl_exec($ch);
curl_close($ch);
echo $result;
?>

I po jego przestudiowaniu napisałem własny skrypt(oczywiście wzorując się, jednak poszukiwania właściwych danych i parametrów prowadziłem sam):

Kod

<?php
$url = "http://www.amazon.com/s/ref=nb_ss_gw";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_FAILONERROR, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_TIMEOUT, 11);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, "url=search-alias=stripbooks&field-keywords=PHP+MYSQL");
$result = curl_exec($ch);
curl_close($ch);
echo $result;
?>

Różnice. URL - ja swój wyczytałem z akcji formularza, zielonego pojęcia nie mam, skąd autor skryptu wytrzasnął swój. Zwiększyłem limit czasu, gdyż moje łącze nie jest kosmiczne, a i Amazon nie śmiga jakoś niesamowicie. POSTFIELDSY również znalazłem w formularzu, oraz dodatkowo w url-u po wpisaniu wyszukiwania ręcznie. Wtedy do mnie dotarło, sprawdziłem i zbaraniałem - formularz w Amazonie przekazuje dane GETem. A obie wersje skryptów działają. Ciekawe, czy gdyby przekazywał POSTem, to by śmigały.
Pytanie skąd biorą się różnice w naszych skryptach? Jak autor oryginału znalazł swoje dane? Jakieś pomysły?

No i gwóźdź programu. Postanowiłem tę samą metodę wykorzystać do innej stronki -

Kod

http://konta.nettur.pl

, ale tutaj nie radzę sobie. Zawsze dostaję tylko stronę główną. Jeśli ktoś mógłby mi pomóc z poprawnym URL i POSTFIELDSAMI, będę niezmiernie wdzięczny. Sprawę komplikuje niesamowicie rozbudowany formularz, korzystający z JS... no albo ja jak zwyklę coś źle robię. Help?

versis

11.07.2008, 17:52:58

Nie wiem czy o to chodzi, ale mi działa. Jakby co to pisz

Kod

<?php

define('UA', 'Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.8.1.8) Gecko/20071008 Firefox/2.0.0.8');
header('Content-Type: text/plain; charset=iso-8859-2');

$url2 = "http://konta.nettur.pl/192133/index?Act=show_doc&id_doc=1318&id_b=12237&id_term=976&DtDate=2008-07-12&NoLength=15";
$cookie_file_path = "cookie.txt";

$ch = curl_init($url2);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file_path);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file_path);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_URL,$url2);
$r = curl_exec($ch);
curl_close($ch);
echo $r;

?>

rycy85

16.07.2008, 19:02:17

Hi all:)
jestem nowy tu więc ładnie witam się ze wszystkimi;)

a teraz do rzeczy:

Versis...
to co Ty zrobiłeś to już żaden problem, bo znalazłeś ofertę z podanego adresu. Szybciej to można zrobić bez cookie i też działa:

Kod

$c = curl_init();
  curl_setopt($c, CURLOPT_URL, "http://domain.pl/xxxxxx/index?Act=show_doc&id_doc=1318&id_b=12237&id_term=976&DtDate=2008-07-12&NoLength=15");
  curl_setopt($c, CURLOPT_RETURNTRANSFER, 0);
  $result = curl_exec($c);
  curl_close($c);

Zabawa się zaczyna dopiero gdy chcesz wyszukać coś u nich:)
Widać, że dane z form są wysyłane do index.rst.
Mój kod:

Kod

$query = "country=".$country."&month=".$month."&day=".$day."&dojazd=".$dojazd."&month_to=".$month_to."&day_to=".$day_to."&type=".$type."&price_select=".$price_select."&only_lm=".$only_lm."&only_fm=".$only_fm;
  $c = curl_init();
  $cookie = 'Ack=' . urlencode('find_trip') . '&find_sess=' . urlencode('1302332414');
  curl_setopt($c, CURLOPT_URL, "http://domain.pl/xxxxxx/index.rst");
  curl_setopt($c, CURLOPT_HEADER, 1);
  curl_setopt($c, CURLOPT_COOKIE, $cookie);
  curl_setopt($c, CURL_POST, 1);
  curl_setopt($c, CURLOPT_FOLLOWLOCATION, 1);// allow redirects
  curl_setopt($c, CURLOPT_POSTFIELDS, $query);
  curl_setopt($c, CURLOPT_RETURNTRANSFER, 0);
  curl_close($c);

niestety już nie działa;/ nie działa również bez cookie, z urlencode() - próbowane na różne sposoby.
może jakieś rady/wskazówki?

Seph84...
Wydaje mi się że tu ten script js, o którym mówisz (jeśli masz na myśli ten odpowiedzialny za miesiące i dni) nie ma nic do tego. Bo i tak dane są wysyłane w dość prostej formie.
Do czego ciekawego się dokopałeś w związku z tym netturem? może ze wspólnych wypocin da się coś wykombinować, żeby to ruszyć...

jakieś sugestie?

Pozdrawiam,
rycy

seph84

16.07.2008, 21:05:11

Tak, dane z formularza są wysyłane do index.rst. Dodatkowo zauważ, że formularz ma kilka ukrytych pól. Z tym JS to chodziło mi o przycisk submit:

Kod

Wiem, że używając cURLa się go omija, ale może właśnie w tym jest problem, bo on coś tam generuje na kliknięciu?

Ja się już wystrzelałem z pomysłów przy tym problemie niestety. Nie wiem już z jakiej strony to próbować ugryżć.

rycy85

17.07.2008, 11:21:12

dobra, udało się:)

mój błąd - nie zauważyłem, że przy submit był javascript - dzięki seph84 za dobrą wskazówkę:)

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.