Forum PHP.pl > wyrażenie regularne

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: wyrażenie regularne

Forum PHP.pl > Forum > PHP

nospor

28.09.2010, 07:57:31

Mam taki ciąg

Kod

START bla bla bla END inneblabla inneblabla

Chcę zamienić wszystko między START a END na coś innego, włącznie ze START i END.
No to piszemy proste wyrażenie:

[PHP] pobierz, plaintext 
$text = 'START bla bla bla END inneblabla inneblabla';
$text2 = preg_replace('/^START\s.*?\sEND/','#zamienione#',$text);
echo $text2;
[PHP] pobierz, plaintext

W rezultacie otrzymamy:

Kod

#zamienione# inneblabla inneblabla

Proste.
Sprawa się komplikuje, gdy pomiędzy START i END włożym podSTART i pod END

Kod

START bla bla bla START blablaW END bla3 END inneblabla inneblabla

W wyniku naszego wyrażenia otrzymamy

Kod

#zamienione# bla3 END inneblabla inneblabla

A powinniśmy otrzymać to samo co w pierwszym przypadku.
No to powiecie: zamien .*? na .* i po sprawie. No nie do końca, bo jest jeszcze jeden przypadek, ze START i END pojawi nam się też rownożędnie do pierwszego, czyli np:

Kod

START bla bla bla START blablaW END bla3 END inneblabla START ccc xxx END inneblabla

Zrobie .* da nam

Kod

#zamienione# inneblabla

a mi chodzi, by uzyskac

Kod

#zamienione# inneblabla START ccc xxx END inneblabla

Podsumowując:
ma być zamienione tylko pierwsze główne START END, nawet jeśli ma w sobie inne START END, ale nie można już ruszych późniejszych START END
Idzie to zrobić wyrażeniem regularnym?

kreciko

28.09.2010, 08:18:58

Musisz w środku tego wyrażenia dodać bardzo podobne, które może wystąpić 0 lub więcej razy. Nie wiem czy dobrze zapisałem:

Kod

^START\s(START\s.*?\sEND)*\sEND

nospor

28.09.2010, 08:25:06

Juz myslalem ze bedzie dobrze ale nie

[PHP] pobierz, plaintext 
$text = 'START bla bla bla START blablaW END bla3 END inneblabla START ccc xxx END inneblabla';
$text2 = preg_replace('/^START\s.*?(START\s.*?\sEND)*.*?\sEND/','#zamienione#',$text);
echo $text2;
[PHP] pobierz, plaintext

Nadal zwraca mi

Kod

#zamienione# bla3 END inneblabla START ccc xxx END inneblabla

Gdy zamienie (START\s.*?\sEND)* na (START\s.*?\sEND)+ to zwraca juz dobrze, ale tylko dla przypadku, gdy te wewnetrzne START END istnieje. Gdy nie będzie istnialo, znowu się wykrzaczy

kreciko

28.09.2010, 09:06:58

[PHP] pobierz, plaintext 
$text2 = preg_replace('/^START.*(START.*END)*.*END/','#zamienione#',$text);
[PHP] pobierz, plaintext

nospor

28.09.2010, 09:08:07

kreciko ale wowczas łyknie też tego ostatniego END a pisałem ze tego nie chce

wookieb

28.09.2010, 09:08:45

preg_replace_callback i trochę rekurencyjnych wywołań.
Nie możesz się posługiwać operatorami kontrolującymi chciwość np (?)

nospor

28.09.2010, 09:12:44

Cytat

Nie możesz się posługiwać operatorami kontrolującymi chciwość np (?)

To pytanie czy stwierdzenie?

wookieb

28.09.2010, 09:14:24

"?" to operator leniwego wybierania znaków

nospor

28.09.2010, 09:17:04

To ja wiem, pytam sie ciebie czy twoj ostatni post to pytanie czy stwierdzenie

Bo jak przejrzysz kody to zauwazysz, ze uzywam leniwego wybierania znaków wiec nie rozumiem sensu twojego zdania

Cytat

Nie możesz się posługiwać operatorami kontrolującymi chciwość np (?)

Wiec sie pytam czy to pytanie czy to stwierdzenie

wookieb

28.09.2010, 09:19:56

Stwierdzenie, że nie możesz go używać

nospor

28.09.2010, 09:24:26

why, wookieb why?

wookieb

28.09.2010, 09:30:20

Dobra może powiedz mi po co chcesz to zrobić? Wiesz, że mój parser bbcode można użyć do innych parserów zmieniając tylko ustawienia?

A dlaczego nie możesz, ponieważ wtedy preg_replace_callback nie będzie w stanie rekurencyjnie wyszukać START i END w tekście bo nigdy nie wystąpi 2x END oraz 2x START w dopasowanym ciągu.

kreciko

28.09.2010, 09:33:09

Cytat(wookieb @ 28.09.2010, 10:08:45 )

Nie możesz się posługiwać operatorami kontrolującymi chciwość np (?)

To pytanie chyba było skierowane do mnie, ponieważ ja je(operator chciwości) pominąłem z powodu niewiedzy. Mea culpa.

nospor

28.09.2010, 09:33:16

Cytat

Dobra może powiedz mi po co chcesz to zrobić?

for money

No jak to po co? Zeby działało

Cytat

A dlaczego nie możesz, ponieważ wtedy preg_replace_callback nie będzie w stanie rekurencyjnie wyszukać START i END w tekście bo nigdy nie wystąpi 2x END oraz 2x START w dopasowanym ciągu.

Ok. Moze się pobawie tym callbackiem

wookieb

28.09.2010, 09:35:29

Cytat(nospor @ 28.09.2010, 10:33:16 )

for money

No jak to po co? Zeby działało

To może tak. Jaką funkcjonalność chcesz stworzyć?

nospor

28.09.2010, 09:39:55

Taką jak opisałem.

Obszedłem to troszke i mam rozwiązanie

[PHP] pobierz, plaintext 
$text = 'START bla bla bla START blablaW END bla3 END inneblabla START ccc xxx END inneblabla';
$text = preg_replace('/^\s*START\s/s','',$text);
$text = preg_replace('/START(\s+.*?\s+)END/s','#START#\\1#END#',$text);
$text = 'START '.$text;
$text = preg_replace('/^START\s+.*?\s+END/s','#zamienione#',$text);
$text = str_replace(array('#START#','#END#'),array('START','END'),$text);
echo $text;
[PHP] pobierz, plaintext

Noidea

28.09.2010, 10:58:07

@nospor
Twój kod sypnie się, jeśli START END będzie zagnieżdżone więcej niż 2 razy. Jeśli się to nigdy nie zdarzy, to OK, ale jeśli ma to działać w każdych warunkach, to lepiej jest wykorzystać tak zwane "recursive subpatterns". Działa to tak samo jak zwykła rekurencja (?R), tyle że nie wstawia tam całego oryginalnego wyrażenia, tylko n-ty nawias okrągły. A zapis jest taki: (?1), (?2), (?n)

[PHP] pobierz, plaintext 
<?php
 
    $text = 'START aa START bb START cc START dd END c END b START cc2 END b2 END a END inneblabla START xxx START yyy END zzz END inneblabla';
 
    echo preg_replace( "~^(START\b((?1)|.)*?\bEND\b)~s", "#zamienione#", $text );
 
?>
[PHP] pobierz, plaintext

nospor

28.09.2010, 11:25:29

Cytat

wój kod sypnie się, jeśli START END będzie zagnieżdżone więcej niż 2 razy. Jeśli się to nigdy nie zdarzy, to OK

Tak, wiem o tym. Z założenie nie będzie jednak takiej sytuacji

Cytat

to lepiej jest wykorzystać tak zwane "recursive subpatterns". Działa to tak samo jak zwykła rekurencja (?R), tyle że nie wstawia tam całego oryginalnego wyrażenia, tylko n-ty nawias okrągły. A zapis jest taki: (?1), (?2), (?n)

Działa wyśmienicie, dzięki

Muszę poczytać o tych rekursywnych wyrażeniach bo próbuje przetrawić ten kod co podales i za chiny go nie kumam

Jeszcze gdzie jakiego backdora mi wlozyles

edit: i już chyba kumam

Z ciekawości zrobiłem testy czasowe.
Wyrażenie regularne jest szybsze od moich "kwiatków"

Noidea

28.09.2010, 11:25:42

Ogólnie to:
1: Dopasuj START
2: Najpierw spróbuj dopasować całe zagnieżdżone START(...)END (rekurencja, GOTO 1: ), a jeśli się nie uda to:
3: Dopasuj jeden znak (kropka)
4: Jeśli napotkałeś END to zakończ, w przeciwnym razie GOTO 2:

EDIT:
No ty w swoich kwiatkach też masz wyrażenia regularne

W dodatku ślamazarność wyrażeń to trochę mit. To znaczy często, jeśli porównujemy regexp z całą masą substr w pętli to okazuje się, że ciągłe kopiowanie stringa w inne miejsca w pamięci daje taki narzut, że wyrażenia okazują się szybsze

nospor

28.09.2010, 11:36:10

Cytat

No ty w swoich kwiatkach też masz wyrażenia regularne

No tak.... czy już dziś piątek czy jak :/

Methestel

28.09.2010, 14:15:09

Chcesz robić walidacja poprawności tekstu (czy liczba START-ów jest równa licznie END-ów)?

nospor

28.09.2010, 18:49:23

Nie wiem jak bardzo trzeba po chinsku czytac by dojsc do takiego wniosku

Poza tym wydaje mi się, iż jestem na takim etapie iż wiem jak policzyć w tekście liczbę dwóch słów i porównać te liczby ze sobą

Problem juz rozwiązany

Methestel

28.09.2010, 20:01:39

Nie doszedłem do takiego wniosku tylko zapytałem czy nie potrzebujesz walidacji bo niedawno sam musiałem zmierzyć się z problemem niepoprawnie zbudowanego tekstu ze znacznikami (np częściowo ucięty XML). Przepraszam, że chciałem podzielić się doświadczeniami :/

nospor

28.09.2010, 20:08:18

Cytat

Przepraszam, że chciałem podzielić się doświadczeniami

No ale chyba nie będziesz latał teraz po różnych tematach i nie pytał każdego czy nie chce usłyszeć jak zrobić coś tam bo akurat to przerabiałeś

Nie zrozum mnie źle: dzielenie się doświadczeniem to fajna sprawa i jak najbardziej to popieram ale rób to we właściwym miejscu i nie wyskakuj ni stąd ni zowąd ludziom w tematach z czymś takim. Poza tym źle zrozumiałem Twojego posta i myslalem że ty źle zrozumiales i wymyslasz jakieś inne rozwiązanie

Methestel

28.09.2010, 20:09:52

Nie będe

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.