Mam jeszcze jedno pytanie i jak ktoś znałby odpowiedź to byłbym wdzięczny.
Problem jest mianowicie taki:
Mam źródło :
<td class="photo"><a href="/waltham/events/womens-basketball-vs-husson-college-home-/E0-001-006386976-2"><img class="event-img" src="http://static.eventful.com/images/thumb/I0-001/000/500/442-6.jpeg" title="Women's Basketball vs Husson College at HOME"></a></td> <a href="/waltham/events/womens-basketball-vs-husson-college-home-/E0-001-006386976-2">Women's Basketball vs Husson College at HOME
</a><span class="no_hover action-item action-item-inactive" alt="E0-001-006386976-2"><img src="/images/transparent.gif" height="13" width="13" /><div class="action-item-hover object-add"><span class="action-copy">Add to Favorites
</span></div><div class="action-item-hover object-remove"><span class="action-copy">Added -
<a href="/my">View Favorites
</a></span></div></span> </h3>
<a href="/waltham/events/womens-basketball-vs-husson-college-home-/E0-001-006386976-2">View event details
</a>
pomiędzy tymi klasami znajduje się wiele klas o nazwie " "
informacje
...........................
.......................
Moim celem jest wyciągnięcie (na przykładzie pierwszej klasy a w późniejszej fazie następnych, bo jet podobna struktura):
<a href="/waltham/events/womens-basketball-vs-husson-college-home-/E0-001-006386976-2">
Próbowałem już chyba wszystkiego...
Najpierw starałem się wyodrębnić chociaż całą tą sekcję kodu
<tr class="first "> dwsad
</tr>
używając
<?php
preg_match('|<tr class="first ">(.+)</tr>|', $zrodlo, $link); ?>
ale nie wyświetla nic, później dodałem "is" na końcu i wyświetlało od <tr class="first "> az do ostatniego </tr> w całym dokumencie. Moim zdaniem problem leży w białych znakach i nowych liniach w źródle, tylko nie wiem jak się go pozbyć. Wiem że trzeba ułożyć właściwy wzorzec ale w dokumentacji funkcji nie ma za wiele o takich przypadkach. Gdyby ktoś chciałby mi pomóc lub znaleźć inne rozwiązanie to czekam. Próbowałem użyć fopen i jak wiadomo zadziałał ale to nie jest chyba za efektywny parser a informacji jest tam sporo. Źródło jest mniej więcej w takiej postaci jak przedstawiłem (spacje, białe znaki, nowe lini itd) Dzięki z góry za odpowiedź.