Forum PHP.pl > [PHP] problem z wyrażeniem regularnym

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP] problem z wyrażeniem regularnym

basstone

19.02.2012, 19:07:43

Witam

Próbuję za pomocą wyrażeń regularnych wyciągnąć treść znajdującą się pomiędzy tagami , oraz . Moje wyrażenie wygląda tak:

[PHP] pobierz, plaintext 
$wzorzec = '</^<[(b|strong|i|u)]+>[a-zA-Z0-9.\-]+</[(b|strong|i|u)]$/>'; // linia 63
preg_match_all($wzorzec, $kodstrony, $tresc, PREG_PATTERN_ORDER); // linia 64
[PHP] pobierz, plaintext

Na stronie wyrzuca mi błąd:
Warning: preg_match_all() [function.preg-match-all]: Unknown modifier '[' on line 64

Czy ktoś mógłby mi wyjaśnić gdzie popełniam błąd? Czytam tutorial za tutorialem i nadal nie mogę dojść do ładu :/

Necsord

19.02.2012, 19:55:23

http://www.php.net/manual/en/regexp.reference.delimiters.php
W zależności od potrzeb zastanów się czy nie bardziej się tobie opłaca użycie DOMDocument.

basstone

19.02.2012, 20:17:45

Ok, ogarnąłem delimitery, ale dlaczego takie wzorzec nie wyświetla mi żadnych wyników?

[PHP] pobierz, plaintext 
$wzorzec = '#^\<[a-zA-Z]+\>$#';
[PHP] pobierz, plaintext

Necsord

19.02.2012, 20:26:59

Ten wzorzec zadziała dla wyrażeń które zaczynają się od < później mają przynajmniej 1 literę, a na końcu znak >. Czyli przykładowo:
<cokolwiek> - tak
<c> - tak
<c dwq> - nie
<> - nie
cokolwiek> - nie

Za wskazanie początku i końca odpowiada odpowiednio ^ i $.

basstone

19.02.2012, 20:29:42

czyli w teorii powinien wyświetlić mi wszystkie znaki z kodu strony prawda? a nie wyświetla nic mimo, że są :/
Potrzebuję wyciągnąć wszystko spomiędzy tagów , , i cokolwiek nie piszę ani razu nie działa, a opieram się na przykładach i instrukcjach z http://pl.wikibooks.org/wiki/PHP/Podstawy_...%84_regularnych

Necsord

19.02.2012, 20:59:49

Twoje wyrażenie regularne jest błędne ponieważ ciąg znaków typu:
costam cos tam
nie zaczyna się od < tylko od "costam".

[PHP] pobierz, plaintext 
$testCases = array(
	'<b> costam </b>' => 'true',
	'<strong> costam </strong>' => 'true',
	'<i> costam </i>' => 'true',
	'<i> costam <strong> costam2 </strong> </i>' => 'true',
	'costam<i>cos</i>costam' => 'true',
	'costam <i>cos</i> costam' => 'true',
	'costam <a>cos</a> costam' => 'false',
	'costam <i></i> costam' => 'false', // bo puste
);
$pattern = '#<([b|strong|i])>(?<wartosc>.+)</\1>#';
[PHP] pobierz, plaintext

Z uwagą, że to nie złapie zagnieżdżonych.

basstone

20.02.2012, 01:10:55

Nie będę zakładał nowego tematu więc dopiszę jeszcze tutaj.

Otóż to, mam taką tablicę i wyrażenie:

[PHP] pobierz, plaintext 
$del = array("a", "aby", "ach", "acz", "aczkolwiek", "aj", "albo", "ale", "ależ", "ani", "aż", "bardziej", "bardzo", "bez", "bo", "bowiem", "by", "byli", "bynajmniej", "być", "był", "była", "było", "były", "będzie", "będą", "cali", "cała", "cały", "ci", "cię", "ciebie", "co", "cokolwiek", "coś", "czasami", "czasem", "czemu", "czy", "czyli", "daleko", "dla", "dlaczego", "dlatego", "do", "dobrze", "dokąd", "dość", "dużo", "dwa", "dwaj", "dwie", "dwoje", "dziś", "dzisiaj", "gdy", "gdyby", "gdyż", "gdzie", "gdziekolwiek", "gdzieś", "go", "i", "ich", "ile", "im", "inna", "inne", "inny", "innych", "iż", "ja", "ją", "jak", "jakaś", "jakby", "jaki", "jakichś", "jakie", "jakiś", "jakiż", "jakkolwiek", "jako", "jakoś", "je", "jeden", "jedna", "jedno", "jednak", "jednakże", "jego", "jej", "jemu", "jest", "jestem", "jeszcze", "jeśli", "jeżeli", "już", "ją", "każdy", "kiedy", "kilka", "kimś", "kto", "ktokolwiek", "ktoś", "która", "które", "którego", "której", "który", "których", "którym", "którzy", "ku", "lat", "lecz", "lub", "ma", "mają", "mało", "mam", "mi", "mimo", "między", "mną", "mnie", "mogą", "moi", "moim", "moja", "moje", "może", "możliwe", "można", "mój", "mu", "musi", "my", "na", "nad", "nam", "nami", "nas", "nasi", "nasz", "nasza", "nasze", "naszego", "naszych", "natomiast", "natychmiast", "nawet", "nią", "nic", "nich", "nie", "niego", "niej", "niemu", "nigdy", "nim", "nimi", "niż", "no", "o", "obok", "od", "około", "on", "ona", "one", "oni", "ono", "oraz", "oto", "owszem", "pan", "pana", "pani", "po", "pod", "podczas", "pomimo", "ponad", "ponieważ", "powinien", "powinna", "powinni", "powinno", "poza", "prawie", "przecież", "przed", "przede", "przedtem", "przez", "przy", "roku", "również", "sam", "sama", "są", "się", "skąd", "sobie", "sobą", "sposób", "swoje", "ta", "tak", "taka", "taki", "takie", "także", "tam", "te", "tego", "tej", "ten", "teraz", "też", "to", "tobą", "tobie", "toteż", "trzeba", "tu", "tutaj", "twoi", "twoim", "twoja", "twoje", "twym", "twój", "ty", "tych", "tylko", "tym", "u", "w", "wam", "wami", "was", "wasz", "wasza", "wasze", "we", "według", "wiele", "wielu", "więc", "więcej", "wszyscy", "wszystkich", "wszystkie", "wszystkim", "wszystko", "wtedy", "wy", "właśnie", "z", "za", "zapewne", "zawsze", "ze", "zł", "znowu", "znów", "został", "żaden", "żadna", "żadne", "żadnych", "że", "żeby",);
 
$out = preg_replace("#(^$del,|,$del$)#", '', $in);
$czysty = preg_replace("#(,$del,)#", ',', $out);
return $czysty;
[PHP] pobierz, plaintext

Chciałbym aby przez preg_replace zastępowano tylko całe słowa, a nie ich fragmenty. Niestety to wyrażenie nie chce mi zadziałać, a dalej nie mogę dojść do ładu z wyr. regularnymi.

Zmienna $czysty cały czas zwraca taki sam tekst jak $in :|

by_ikar

20.02.2012, 08:23:32

Zastanów się w jaki sposób przekazujesz tą tablicę. Weź sobie to:

[PHP] pobierz, plaintext 
echo "#(^$del,|,$del$)#";
[PHP] pobierz, plaintext

i wyświetl to sobie, a się przekonasz jakie piękne wyrażenie dostajesz i dlaczego nie może zostać dopasowane.

Druga sprawa to jest taka że ciężko ci będzie stworzyć wyrażenie które się domyśli że to jest cały wyraz a nie tylko jego część. Raczej będziesz musiał szukać wyrazu który jest poprzedzony spacją i zakończony spacją lub kropką, lub przecinkiem. Czyli przewidywanie pozytywne.

Do preg_replace, można przekazać tablicę jako argument, ale nie w taki sposób jak ty to robisz.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.