Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [php] Przetwarzanie html i wyciagnie info z tagow
Forum PHP.pl > Forum > PHP
kiler129
Mam sobie plik html z duza iloscia informacji i potrzbuje "wycisnac" z neigo wsyztkie dane umieszczone w tagach <abc> COSTAM </abc>.
Tych tagow jest duzo, na #php doradzili mi zbym uzyl preq_match ale nie umiem pisac regex czarodziej.gif
Ma ktos pomysl jak to inaczej rozwiazac lub bylby tak dobry i napisal odpowiedni regex dla mnie? Bede niezmiernie wdzeczny.
p.s. Nie wchodza w gre jakies explody i wyciaganie tego w ten sposob - dancyh jest ok 500MB w wielu plikach - chce skaczyc przetwarzac przed 2199r biggrin.gif
bim2
Wyciągnie wszysto pomiędzy <abc> </abc>
  1. <?php
  2. preg_match_all('!<abc>(.+?)</abc>!is', $sText, $aMatches);
  3. ?>
pyro
  1. <?php
  2. $plik = 'bla.html';
  3. $text = file_get_contents($plik);
  4. $a = preg_match_all('|<abc>.*?</abc>|si', $text, $tablica_gowienek);
  5. // tablica gowienek zawiera wszystkie znalezione rzeczy
  6. ?>
bim2
User pisał, że to duży plik i założę się że między <abc> występują entery. smile.gif I co wtedy?

Dodaj modyfikator s do kodu kolegi i też będzie dobrze winksmiley.jpg
pyro
Cytat(bim2 @ 25.08.2008, 10:06:10 ) *
User pisał, że to duży plik i założę się że między <abc> występują entery. smile.gif I co wtedy?

Dodaj modyfikator s do kodu kolegi i też będzie dobrze winksmiley.jpg


pominąłem ten szczegoł tongue.gif, poprawiam

a od kolegi wyżej usuń wszystkie backslashe, bo próbował ominąć interpretację znaków, które nie mają specjalnego znaczenia hihi.
bim2
Nigdy nie pamiętam co ma a co nie haha.gif a nie miałem zamiaru, żeby user pisał, że nie działa biggrin.gif:D Kiedyś muszę jakoś zapamiętać co oddziałuje, ale backslashe nic nie psują smile.gif a s tak haha.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.