Mam plik HTML pobrany z zewnętrznego serwera i chcę z niego wyciągnąć niektóre informacje (dokładnie to chodzi o podstrony z Moje Allegro) tylko nie mogę znaleźć jakiegoś parsera do HTML który byłby odporny na nie poprawny kod a szukanie poprzez preg_match też ciężko tu zastosować bo w kodzie jest duży bałagan.
Przykładowy wiersz z danymi:
<td class="list-color" align=center valign=top> <input type="checkbox" name="auctions_array[XXXXXXXXX]" value="XXXXXXXXX"> <td class="list-color" style="text-align: left"> <a href="/itemXXXXXXXXX.html">Nazwa
</a> <a href="java script:open_note_edit('XXXXXXX', 'XXXXXXXXX', '1');" class="tip"> <div class="tip">Tutaj możesz dodać notatkę o tym przedmiocie
</div> <img src="/site_images/1/0/notes-inactive.gif" class="note-img" alt="" title="" border="0"> <td class="list-color">1
<td class="list-color">4 dni
<br> <i>(pią 12 sty 2007 19:45:29 CET)
</i> <td class="list-color">12
<td class="list-color"><span class="small">-
</span> <td class="list-color"><span class="small">200,00 zł
</span> <a href="/item_change.php?item_id=XXXXXXXXX">Zmiany
</a><br> <a href="/change_payu_option_do.php?item_id=XXXXXXXXX&action=add&type=sell">Dodaj Płatności Allegro
</a><br> <span style="white-space: nowrap;"><a href="/new_item.php?next_item_id=XXXXXXXXX">Wystaw podobną
</a>
Ma ktoś pomysł jak wyciągnąć te dane?