Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Wyłuskanie danych ze strony htm
Forum PHP.pl > Forum > PHP
RaRu
Witam,

Jak Waszym zdaniem najszybciej i najskuteczniej wyłuskać dane ze strony o strukturze http://gimtur.strefa.pl/oferta.htm.

Chodzi oczywiście o dane: nr rej, marka, typ, opis...., najlepiej jakby je można było wrzucić do tablicy, ponieważ później chcę je zapisać w bazie danych w odpowiednich kolumnach.

Kombinowałem za pomocą strip_tags oraz preg_replace, ale na stronie niektóre pojazdy mają jedną linię opisu, inne kilka, także brak regularności aby jakiś prosty szablon zastosować.

Być może ktoś z Was miał już tego typu problem i sobie z nim poradził, będę wdzięczny za pomoc. Pozdrawiam
Strzałek
Jak to brak regularności? Wszystko siedzi w tabeli, więc można to wyrażeniami regularnymi potraktować, tak jak robią to wszyscy. Przykładem może być np. skrypt TV, tiraeth'a - http://tiraeth.kom.pl/tv/index.php
Dane pobiera z tv.wp.pl by później zrobić sobie z tym co mu się podoba czyli ładny rozkład jazdy tv winksmiley.jpg


Poszukaj, bo problemy z regułkami do wyłuskiwania danych z tabel i ogólnie html'a było trochę winksmiley.jpg
marcini82
Jesli dane byly w tabeli to ja to robilem tak:
1. Odrzucenie wszystkiego przed i za wybrana tabela za pomoca substr(). Szukalem tu jakichs charakterystycznych punktow (klasa lub id tabeli albo jakiegos innego pobliskiego elementu) i na tym sie opieralem.
2. Jak juz mamy tabele to mozna ja podzielic na wiersze za pomoca explode() - jako rozdzielacz np. <tr>
3. Jak mamy wiersze w tablicy to dzielimy na komorki wykorzystujac <td>
4. Potem mozna juz posprzatac smieci za pomoca strip_tags(), ewentualnie jeszcze jakas kosmetyka i gra smile.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.