Forum PHP.pl > Parser (nie do końca poprawnego) HTML

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: Parser (nie do końca poprawnego) HTML

suda

8.01.2007, 13:21:29

Mam plik HTML pobrany z zewnętrznego serwera i chcę z niego wyciągnąć niektóre informacje (dokładnie to chodzi o podstrony z Moje Allegro) tylko nie mogę znaleźć jakiegoś parsera do HTML który byłby odporny na nie poprawny kod a szukanie poprzez preg_match też ciężko tu zastosować bo w kodzie jest duży bałagan.

Przykładowy wiersz z danymi:

[HTML] pobierz, plaintext 
<tr>
<td class="list-color" align=center valign=top>
<input type="checkbox" name="auctions_array[XXXXXXXXX]" value="XXXXXXXXX">
<td class="list-color" style="text-align: left">
<a href="/itemXXXXXXXXX.html">Nazwa</a> 
<a href="java script:open_note_edit('XXXXXXX', 'XXXXXXXXX', '1');" class="tip">
	<div class="tip">Tutaj możesz dodać notatkę o tym przedmiocie</div>
	<img src="/site_images/1/0/notes-inactive.gif" class="note-img" alt="" title="" border="0">
</a><br />
<span class=small>(XXXXXXXXX)</span>  
<td class="list-color">1<td class="list-color">4 dni<br>
<i>(pią 12 sty 2007 19:45:29 CET)</i>
<td class="list-color">12
<td class="list-color">0
<td class="list-color"><span class="small">-</span>
<td class="list-color"><span class="small">200,00 zł</span>
<td class="list-color">-
<td class="list-color">-
<td class="list-color">
<a href="/item_change.php?item_id=XXXXXXXXX">Zmiany</a><br>
<a href="/change_payu_option_do.php?item_id=XXXXXXXXX&action=add&type=sell">Dodaj Płatności Allegro</a><br>
<span style="white-space: nowrap;"><a href="/new_item.php?next_item_id=XXXXXXXXX">Wystaw podobną</a>
</TR>
[HTML] pobierz, plaintext

Ma ktoś pomysł jak wyciągnąć te dane?

Cysiaczek

8.01.2007, 13:29:32

Jak nie chcesz pregmatcha, to może spróbuj interfejs DOM. - IMO jednak pregmatch będzie szybszy (zależy ile danych chcesz wyciągnąć).

Pozdrawiam.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.