Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [PHP]wyciąganie alt="" z <img /> - wyrażenie regularne
Forum PHP.pl > Forum > Przedszkole
neo1986kk
Witam, mam wyrażenie regularne które pobiera mi obrazki ze storny

  1. $preg='#<\s*img\s+[^>]*src\s*=\s*["\']?([^"\'>]+\.jpg)#i'


Wszystko jest ok ale chciałbym, żeby wybierał również treść tagu alt=""

Czy mógłby mi ktoś pomóc przerobić to wyrażenie?
bostaf
Chodzi Ci tylko o atrybuty src i alt (i pominięcie pozostałych), czy o cały tag? Jeśli cały to:
  1. $preg = '#<img[^>]*>#i';
neo1986kk
już sobie jakoś poradziłem, chodziło mi o to żeby był src i alt, ale ma wyciągać tylko jpg, więc trzeba było przerobić to moje wyrażenie

Zrobiłem coś takiego
  1. $preg='#<\s*img\s+[^>]*src\s*=\s*["\']?([^"\'>]+\.jpg)+["\']?\s*[^>]*alt\s*=\s*["\']?(.*)#i';

ale problem polega na tym ze pobiera tylko te obrazki które zawierają atrybut alt a innych nie więc poprawiłem na coś takiego
- dodałem znaczniki []
  1. $preg=''#<\s*img\s+[^>]*src\s*=\s*["\']?([^"\'>]+\.jpg)+["\']?\s*[^>]*[alt\s*=\s*["\']?(.*)]*#i';

i teraz nie pobiera mi alt do $matches

Wiecie może jak to można ruszyć?
bostaf
To co ma być przechwytywanym "podwzorcem" wzorca, musi być w zwykłych nawiasach:
  1. $preg='#<\s*img\s+[^>]*src\s*=\s*["\']?([^"\'>]+\.jpg)+["\']?\s*[^>]*alt\s*=\s*["\']?(.*)["\']+#i';
neo1986kk
no prawie dobrze, ale wróciliśmy do tego co wymyśliłem wcześniej

poprostu on nie pobiera teraz obrazków w których nie ma atrybutu alt=""

a trzeba stworzyć coś takiego że jeśli obrazek ma alt to go pobiera a jeśli nie to pobiera samo src

tak jak by całe wyrażenie
alt\s*=\s*["\']?(.*)["\'] mogło wystąpić lub nie czyli na pewno nie może być na końcu "+" bo oznacza on jeden lub więcej, a musi być 1 lub 0 czyli bardziej odpowiedni był by tu "?", zaraz sprawdzę jak to zadziała

no niestety z ? też nie działa

nie wiem jak załatwić sprawę z tym wyrażeniem całym że może być 1 lub 0 i myślę że tu tkwi cały problem
bostaf
Cytat(neo1986kk @ 18.05.2012, 23:46:48 ) *
poprostu on nie pobiera teraz obrazków w których nie ma atrybutu alt=""

No racja, pisałeś o tym ale jak zacząłem kombinować to o tym zapomniałem smile.gif Niezła łamigłówka, też będę kombinował.
BaN
Możesz spróbować:
  1. $preg='#<\s*img\s+src\s*=\s*["\']?([^"\'>]+\.jpg)["\']?(\s+alt\s*=\s*["\']?([^"\'>]+)["\']?)?.*>#i';

Jeśli znacznik zostanie zapisany poprawnie z atrybutem alt="..." lub od razu za alt jest >, to będzie ok

Ale to wyrażenie nie jest dobre dla np.
  1. <img src="obrazek.jpg" alt=aaa style="margin:10px" />

Oczywiście będzie źle, jeśli kolejność atrybutów będzie inna lub między src i alt coś się pojawi oprócz białych znaków
k_@_m_i_l
Zamiast bawić się w wyrażenia regularne, polecam zainteresować się czymś takim jak:
http://sourceforge.net/projects/simplehtmldom/

Dużo bardziej Ci ułatwi pracę, a w razie zmiany kolejności atrybutów nie będziesz musiał się bawić w zmianę wyrażenia regularnego.
bostaf
@k_@_m_i_l Jasne że parser HTMLa będzie najodpowiedniejszy. Chociaż w tym konkretnym przypadku zwykła funkcyjka PHP byłaby prostszym i szybszym rozwiązaniem. Też chciałem zapytać neo1986kk czy inne rozwiązanie wchodzi w grę. Dla mnie ten temat to bardziej fajna łamigłówka niż problem smile.gif

Cytat(BaN @ 19.05.2012, 14:35:13 ) *
Możesz spróbować:
  1. $preg='#<\s*img\s+src\s*=\s*["\']?([^"\'>]+\.jpg)["\']?(\s+alt\s*=\s*["\']?([^"\'>]+)["\']?)?.*>#i';

Jeśli znacznik zostanie zapisany poprawnie z atrybutem alt="..." lub od razu za alt jest >, to będzie ok

To jest już chyba prawie OK. Bez alta pozostałe zmienne są NULL. Ale z altem jest mały problem bo drugie dopasowanie to alt="jakiś alt" a jest i trzecie: jakiś alt. Mały finetuning i będzie OK smile.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.