Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [inne][HTML][PHP]parsowanie strony
Forum PHP.pl > Forum > Przedszkole
bluebird
witam próbuje sparsować stronę z list± hoteli (nazwa i adres) np.

CODE
$zm = file_get_contents("http://www.hotele.gpv.pl/augustow.php");
$regExp="|(.+)<div class=\"Section1\">(.+)<p class=\"MsoNormal\"><b>(.+)<\/b><\/p><p class=\"MsoNormal\">(.+)<\/p>(.+)<\/div>(.+)|";
preg_match_all($regExp, $zm, $info, PREG_SET_ORDER);


i nie działa aaevil.gif , wyrażenia regularne s± moj± słab± stron± więc tam jest problem - czy mógłby kto¶ zerkn±ć w kod... smile.gif
neverever
wszystkie wpisy pobierzesz tak
  1. $regExp='/<p.class=MsoNormal>(.+?)<\/p>/';
  2. preg_match_all($regExp, $zm, $info);


wynikowa tablica będzie taka Array
(
[0] => Array
(
[0] => <p class=MsoNormal><b>Hotel „Warszawa”</b></p>
[1] => <p class=MsoNormal>ul. Zdrojowa 1</p>
[2] => <p class=MsoNormal>te. (0-87) 643 28 05, </p>
[3] => <p class=MsoNormal>607 294 243</p>
[4] => <p class=MsoNormal><a href="http://www.hotelwarszawa.pl/">www.hotelwarszawa.pl</a></p>
[5] => <p class=MsoNormal>&nbsp;</p>
[6] => <p class=MsoNormal><b>Hotel &quot;SPA Wojciech&quot;</b></p>
[7] => <p class=MsoNormal>Wojciech 15,</p>
[8] => <p class=MsoNormal>tel. (0-87) 644 72 37, (0-87) 644 72 38; </p>
[9] => <p class=MsoNormal><a href="http://www.augustow-wojciech.pl/">www.augustow-wojciech.pl</a></p>
[10] => <p class=MsoNormal><a href="http://www.hotelwojciech.pl/">www.hotelwojciech.pl</a></p>
[11] => <p class=MsoNormal>&nbsp;</p>
[12] => <p class=MsoNormal><b>Hotel „Leśnik”</b></p>
[13] => <p class=MsoNormal>ul. Turystyczna 19a</p>
[14] => <p class=MsoNormal>tel (0-87) 644 35 70; </p>
[15] => <p class=MsoNormal>tel/fax.(0-87) 644 36 70</p>
[16] => <p class=MsoNormal><a href="http://www.lesnik.pl/">www.lesnik.pl</a></p>
[17] => <p class=MsoNormal>&nbsp;</p>
)

[1] => Array
(
[0] => <b>Hotel „Warszawa”</b>
[1] => ul. Zdrojowa 1
[2] => te. (0-87) 643 28 05,
[3] => 607 294 243
[4] => <a href="http://www.hotelwarszawa.pl/">www.hotelwarszawa.pl</a>
[5] => &nbsp;
[6] => <b>Hotel &quot;SPA Wojciech&quot;</b>
[7] => Wojciech 15,
[8] => tel. (0-87) 644 72 37, (0-87) 644 72 38;
[9] => <a href="http://www.augustow-wojciech.pl/">www.augustow-wojciech.pl</a>
[10] => <a href="http://www.hotelwojciech.pl/">www.hotelwojciech.pl</a>
[11] => &nbsp;
[12] => <b>Hotel „Leśnik”</b>
[13] => ul. Turystyczna 19a
[14] => tel (0-87) 644 35 70;
[15] => tel/fax.(0-87) 644 36 70
[16] => <a href="http://www.lesnik.pl/">www.lesnik.pl</a>
[17] => &nbsp;
)

)


wiadomo, element $info[0][] = '<p class=MsoNormal>&nbsp;</p>'
lub $info[1][] = '&nbsp'

-oznacza koniec danych hotelu
bluebird
wielkie dzieki smile.gif
To jest wersja lo-fi głównej zawarto¶ci. Aby zobaczyć pełn± wersję z większ± zawarto¶ci±, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.