Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Wyciąganie zawartości ze strony.
Forum PHP.pl > Forum > PHP
Kashikumek
Witam !
Otóż posiadam taki kod>
  1. <?php
  2. $file = fopen("page.xml", "w");
  3. $c = curl_init();
  4. curl_setopt($c, CURLOPT_URL, "url.strony");
  5. curl_setopt($c, CURLOPT_FILE, $file);
  6. curl_exec($c);
  7. curl_close($c);
  8. fclose($file);
  9. ?>

Który elegancko zapisuje mi całą strone jako xml.. no właśnie ! a czy jest możliwość aby zmodyfikować kod , tak aby zapisywał w pliku page.xml tylko zawartość znacznika class albo div ?

Czy sama edycja w/w kodu nie wystarczy ? czy będe musiał użyć czegoś jeszcze ?
Comandeer
Będziesz musiał użyć DOM i prawdopodobnie XPath
damian.1923
polecam to:
http://simplehtmldom.sourceforge.net/
prosta składnia, podobna do CSS i JQuery,
możliwości daje potężne
Comandeer
@damian.1923 a ja właśnie nie polecam, bo nie radzi sobie z bardziej skomplikowanym HTML-em (np. nie rozumie *, wyciągnięcie DOCTYPE graniczy z cudem, o obsłudze błednego HTML zgodnie ze specką to można zapomnieć) i w dodatku traktuje go jako string -> http://stackoverflow.com/a/1732454. Jak już to od siebie polecę duet od Symfony: DOMCrawler + CSSSelector
qweluke
@Comandeer ale kolega @Kashikumek chce tylko zawartość(i) jakichś div'ów (czy tam klas) więc mu to w zupełności wystarczy, tym bardziej że ta biblioteka jest banalnie prosta i zrobi to w kilku linijkach
damian.1923
@Comandeer, dzięki za uświadomienie, nie miałem nigdy problemów z tą biblioteką, ale pewnie nie robiłem tak zaawansowanych rzeczy jakich potrzebowałeś.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.