Za pomocą cURL chce "wejść" na daną stronę. Następnie przeszukać ją w poszukiwaniu danego słowa np. php
Chce też żeby to słowo było wyświetlane na tej słowie jako url tj.
Jak mój skrypt znajdzie coś takiego jak wyżej to wchodzi w ten link i tam wykonuje jeszcze inne operaje.
Tylko nie wysyłajcie mnie do manula bo się go oczytałem sporo i przykładów też.
Wiem o istnieniu funkcji preg_match i preg_match_all, ale nie umiem posługiwać się tymi dziwnymi znaczkami to znalezienia czegoś np.
<?php $preg ="/a[s]+[^>]*?href[s]?=[s"']+(.*?)["']+.*?>([^<]+|.*?)?</a>/"; preg_match(trim($preg), "$data", $matches);
Tak narazie wygląda moj program. Czyli nic wielkiego
<?php $strona = "http://strona.pl/"; $ch = curl_init(); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL,"$strona"); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.8.0.6) Gecko/20060728 Firefox/1.5.0.6'); 'Accept-Charset: ISO-8859-2,utf-8;q=0.7,*;q=0.7', 'Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5'); curl_setopt($ch, CURLOPT_HTTPHEADER, $headers); //send referer page curl_setopt($ch, CURLOPT_REFERER, 'http://google.pl'); // gzip, deflate curl_setopt($ch, CURLOPT_ENCODING, ''); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); //cookies curl_setopt($ch, CURLOPT_COOKIEJAR, "my_cookies.txt"); //initiates cookie file if needed curl_setopt($ch, CURLOPT_COOKIEFILE, "my_cookies.txt"); // Uses cookies from previous session if exist //post curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, ""); $data = curl_exec($ch); curl_close ($ch); ?>
Przepraszam, że odświeżam temat, ale czegoś sie dopracowałem więc może więcej mi pomożecie.
<?php //znajduje ciąg z adresem $urlpattern = '/<a[^>]+href="([^"]+)/i'; foreach ($matches[1] as $u) { } ?>
Ten kod znajduje mi wszystkie url na stronie a bez odnośników tzn. znajduje to
http://jakas.strona.pl
A ja musze mieć
Proszę pomóżcie. Buduje coś w rodzaju prostego webspider'a.
A może znacie jekieś gotowe proste skrypty
