Forum PHP.pl > [PHP]Funkcja usuwająca znaki niealfanumeryczne

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP]Funkcja usuwająca znaki niealfanumeryczne

Mesajah

2.03.2011, 02:11:17

Witam,

Czy jest jakaś funkcja, która pozwala usuwać wszystkie znaki niealfanumeryczne ze stringa (w celu stworzenia przyjaznego linka) ?

Np chciałbym zamienić:

[PHP] pobierz, plaintext 
$a='Adam Mickiewicz - Dziady (1820)!'^&*_';
[PHP] pobierz, plaintext

na:

[PHP] pobierz, plaintext 
$b='adam-mickiewicz-dziady-1820';
[PHP] pobierz, plaintext

Jak najprościej osiągnąć taki efekt ?

darko

2.03.2011, 02:21:01

Spróbuj

[PHP] pobierz, plaintext 
preg_replace("/[^a-zA-Z0-9\s]/", "", $string);
[PHP] pobierz, plaintext

mesajah

2.03.2011, 02:56:56

Dzięki, część już jest ok, ale znalazłem jeszcze coś takiego:

[PHP] pobierz, plaintext 
class hUrls
{
    private $a = array( 'Ę', 'Ó', 'Ą', 'Ś', 'Ł', 'Ż', 'Ź', 'Ć', 'Ń', 'ę', 'ó', 'ą',
                'ś', 'ł', 'ż', 'ź', 'ć', 'ń' );
    private $b = array( 'E', 'O', 'A', 'S', 'L', 'Z', 'Z', 'C', 'N', 'e', 'o', 'a',
                's', 'l', 'z', 'z', 'c', 'n' );
 
    public function Parse( $string )
    {
        $string = str_replace( $this -> a, $this -> b, $string );
        $string = preg_replace( '#[^a-z0-9]#is', ' ', $string );
        $string = trim( $string );
        $string = preg_replace( '#\s{2,}#', ' ', $string );
        $string = str_replace( ' ', '-', $string );
        return $string;
    }
}
[PHP] pobierz, plaintext

Gdy próbuję wywołać tą funkcję:

[PHP] pobierz, plaintext 
$string="śćą#$$$   --śćóżź";
echo Parse($string);
[PHP] pobierz, plaintext

Dostaje info:
Call to undefined function Parse()

Dlaczego ?

d3ut3r

2.03.2011, 04:36:26

Skoro tworzysz klasę hUrls to wypadałoby stworzyć obiekt tej klasy. Ewentualnie możesz wywołać to tak:

[PHP] pobierz, plaintext 
 echo hUrls::Parse($string);
[PHP] pobierz, plaintext

pod warunkiem, że w kodzie klasy zmienisz Parse na metodę statyczną (jak słusznie zauważył Darko niżej). W przypadku gdy nie zmieniasz kodu klasy użyj konstrukcji z postu niżej.

darko

2.03.2011, 10:52:30

~d3ut3r to nie jest metoda statyczna, więc należy utworzyć obiekt klasy hUrls:

[PHP] pobierz, plaintext 
$t = new hUrls();
echo $t->Parse('test1234');
[PHP] pobierz, plaintext

thek

2.03.2011, 11:44:02

To ja podam Ci złożony gotowiec złożony z nieco przerobionych 2 funkcji biblioteki utf8 i helpera url kohany 2.x

[PHP] pobierz, plaintext 
function title($title, $separator = '-') {
    $separator = ($separator === '-') ? '-' : '_';
// Replace all characters that are national accents
    $UTF8_ACCENTS = array( 'ŕ' => 'a',  'ô' => 'o',  'ď' => 'd',  'ḟ' => 'f',  'ë' => 'e',  'š' => 's',  'ơ' => 'o', 'ß' => 'ss', 'ă' => 'a',  'ř' => 'r',  'ț' => 't',  'ň' => 'n',  'ā' => 'a',  'ķ' => 'k', 'ŝ' => 's',  'ỳ' => 'y',  'ņ' => 'n',  'ĺ' => 'l',  'ħ' => 'h',  'ṗ' => 'p',  'ó' => 'o', 'ú' => 'u',  'ě' => 'e',  'é' => 'e',  'ç' => 'c',  'ẁ' => 'w',  'ċ' => 'c',  'ő' => 'o', 	'ṡ' => 's',  'ř' => 'o',  'ģ' => 'g',  'ŧ' => 't',  'ș' => 's',  'ė' => 'e',  'ĉ' => 'c', 'ś' => 's',  'î' => 'i',  'ű' => 'u',  'ć' => 'c',  'ę' => 'e',  'ŵ' => 'w',  'ṫ' => 't', 'ū' => 'u',  'č' => 'c',  'ö' => 'o',  'č' => 'e',  'ŷ' => 'y',  'ą' => 'a',  'ł' => 'l', 'ų' => 'u',  'ů' => 'u',  'ş' => 's',  'ğ' => 'g',  'ļ' => 'l',  'ƒ' => 'f',  'ž' => 'z', 'ẃ' => 'w',  'ḃ' => 'b',  'ĺ' => 'a',  'ě' => 'i',  'ď' => 'i',  'ḋ' => 'd',  'ť' => 't', 'ŗ' => 'r',  'ä' => 'a',  'í' => 'i',  'ŕ' => 'r',  'ę' => 'e',  'ü' => 'u',  'ň' => 'o',  'ē' => 'e',  'ń' => 'n',  'ń' => 'n',  'ĥ' => 'h',  'ĝ' => 'g',  'đ' => 'd',  'ĵ' => 'j', '˙' => 'y',  'ũ' => 'u',  'ŭ' => 'u',  'ư' => 'u',  'ţ' => 't',  'ý' => 'y',  'ő' => 'o', 'â' => 'a',  'ľ' => 'l',  'ẅ' => 'w',  'ż' => 'z',  'ī' => 'i',  'ă' => 'a',  'ġ' => 'g', 'ṁ' => 'm',  'ō' => 'o',  'ĩ' => 'i',  'ů' => 'u',  'į' => 'i',  'ź' => 'z',  'á' => 'a', 'ű' => 'u',  'ţ' => 'th', 'đ' => 'dh', 'ć' => 'ae', 'ľ' => 'u',  'ĕ' => 'e', 'Ŕ' => 'A',  'Ô' => 'O',  'Ď' => 'D',  'Ḟ' => 'F',  'Ë' => 'E',  'Š' => 'S',  'Ơ' => 'O', 'Ă' => 'A',  'Ř' => 'R',  'Ț' => 'T',  'Ň' => 'N',  'Ā' => 'A',  'Ķ' => 'K',  'Ĕ' => 'E', 'Ŝ' => 'S',  'Ỳ' => 'Y',  'Ņ' => 'N',  'Ĺ' => 'L',  'Ħ' => 'H',  'Ṗ' => 'P',  'Ó' => 'O', 'Ú' => 'U',  'Ě' => 'E',  'É' => 'E',  'Ç' => 'C',  'Ẁ' => 'W',  'Ċ' => 'C',  'Ő' => 'O', 'Ṡ' => 'S',  'Ř' => 'O',  'Ģ' => 'G',  'Ŧ' => 'T',  'Ș' => 'S',  'Ė' => 'E',  'Ĉ' => 'C', 'Ś' => 'S',  'Î' => 'I',  'Ű' => 'U',  'Ć' => 'C',  'Ę' => 'E',  'Ŵ' => 'W',  'Ṫ' => 'T', 'Ū' => 'U',  'Č' => 'C',  'Ö' => 'O',  'Č' => 'E',  'Ŷ' => 'Y',  'Ą' => 'A',  'Ł' => 'L', 'Ų' => 'U',  'Ů' => 'U',  'Ş' => 'S',  'Ğ' => 'G',  'Ļ' => 'L',  'Ƒ' => 'F',  'Ž' => 'Z', 'Ẃ' => 'W',  'Ḃ' => 'B',  'Ĺ' => 'A',  'Ě' => 'I',  'Ď' => 'I',  'Ḋ' => 'D',  'Ť' => 'T', 'Ŗ' => 'R',  'Ä' => 'A',  'Í' => 'I',  'Ŕ' => 'R',  'Ę' => 'E',  'Ü' => 'U',  'Ň' => 'O', 'Ē' => 'E',  'Ń' => 'N',  'Ń' => 'N',  'Ĥ' => 'H',  'Ĝ' => 'G',  'Đ' => 'D',  'Ĵ' => 'J', 'Ÿ' => 'Y',  'Ũ' => 'U',  'Ŭ' => 'U',  'Ư' => 'U',  'Ţ' => 'T',  'Ý' => 'Y',  'Ő' => 'O', 	'Â' => 'A',  'Ľ' => 'L',  'Ẅ' => 'W',  'Ż' => 'Z',  'Ī' => 'I',  'Ă' => 'A',  'Ġ' => 'G', 'Ṁ' => 'M',  'Ō' => 'O',  'Ĩ' => 'I',  'Ů' => 'U',  'Į' => 'I',  'Ź' => 'Z',  'Á' => 'A', 'Ű' => 'U',  'Ţ' => 'Th', 'Đ' => 'Dh', 'Ć' => 'Ae' );
    $title = str_replace( array_keys($UTF8_ACCENTS), array_values($UTF8_ACCENTS), $title );
 
// Remove all characters that are not the separator, a-z, 0-9, or whitespace
    $title = preg_replace('/[^'.$separator.'a-z0-9\s]+/', '', strtolower($title));
 
// Replace all separator characters and whitespace by a single separator
    $title = preg_replace('/['.$separator.'\s]+/', $separator, $title);
 
// Trim separators from the beginning and end
    return trim($title, $separator);
}
[PHP] pobierz, plaintext

Mesajah

3.03.2011, 01:34:10

Skrypt Theka będzie chyba dobry do utf8- (tego mi brakuje), ale nie zamienia ogonków.
Tak w ogóle jak on działa ?
Na co zamienia znaki w utf skoro nie widzę tam drugiej tablicy (tej na które znaki są zamieniane).

Ja zmodyfikowałem inny skrypt na swoje potrzeby i wyszło coś takiego:

[PHP] pobierz, plaintext 
function plCharset($string) {
 
	$string = str_replace(".", "-", $string);
	$string = str_replace("[", "-", $string);
	$string = str_replace("]", "-", $string);
	$string = str_replace("(", "-", $string);
	$string = str_replace(")", "-", $string);
	$string = str_replace("<", "-", $string);
	$string = str_replace(">", "-", $string);
	$string = str_replace("*", "-", $string);
 
    $string = strtolower($string);
    $polskie = array(',', ' - ',' ','ę', 'Ę', 'ó', 'Ó', 'Ą', 'ą', 'Ś', 's', 'ł', 'Ł', 'ż', 'Ż', 'Ź', 'ź', 'ć', 'Ć', 'ń', 'Ń','-',"'","/","?", '"', ":", 'ś', '!','.', '&', '&amp;', '#', ';', '[',']','domena.pl', '(', ')', '`', '%', '”', '„', '…');
    $miedzyn = array('-','-','-','e', 'e', 'o', 'o', 'a', 'a', 's', 's', 'l', 'l', 'z', 'z', 'z', 'z', 'c', 'c', 'n', 'n','-',"","","","","",'s','','', '', '', '', '', '', '', '', '', '', '', '', '');
    $string = str_replace($polskie, $miedzyn, $string);
    $string = str_replace("_", "-", $string);
 
 
    // usuń wszytko co jest niedozwolonym znakiem
    $string = preg_replace('/[^0-9a-z\-]+/', '', $string);
 
    // zredukuj liczbę myślników do jednego obok siebie
    $string = preg_replace('/[\-]+/', '-', $string);
 
    // usuwamy możliwe myślniki na początku i końcu
    $string = trim($string, '-');
 
    $string = stripslashes($string);
 
    // na wszelki wypadek
    $string = urlencode($string);
 
    return $string;
}
[PHP] pobierz, plaintext

Może się komuś przyda.

Fajnie zamienia praktycznie wszystko na takie linki o jakie chodzi, tylko dlaczego pewne znaki i tak muszę zastępować str_replace

*._ ...to są jakieś specjalne znaki ?
Jak w takim razie działa to:

[PHP] pobierz, plaintext 
$string = preg_replace('/[^0-9a-z\-]+/', '', $string);
[PHP] pobierz, plaintext

Wykrzyknik usunie a nawiasów, gwiazdek, podkreślników nie ?

thek

3.03.2011, 08:42:56

Mesajah... Jak widzę nie przyjrzałeś się JAK działa ten kod. Podaje tablicę znaków innych niż a-z, a więc diakrytyki narodowe jako klucze tablicy, a wartości tablicy to znaki na jakie podczas konwersji się zamienia je w str_replace. Stąd nie mam dwóch tablic, a tylko jedną. W str_replace jako argumenty podaję raz array_keys, a raz array_values. Potem usuwam wszystkie inne jakie jeszcze zostały i na koniec wielokrotne wystąpienie separatora czy spacji zastępujemy pojedynczym separatorem. A dla pewności trimujemy string z możliwych separatorów na obu końcach stringa. Co do preg_replace i problemów z niektórymi znakami to może ich nie zaescape'owałeś? * czy . to znaki specjalne wyrażeń regularnych i muszą być poprzedzone znakiem ucieczki by traktował je dosłownie. Ja to "olewam" i usuwam je jako niealfanumeryczne w 8 linii wyrażeniem. A poza tym to chyba masz coś nie tak z parserem, bo podane przez Ciebie na końcu wyrażenie usuwa ze stringa * ( ) _ i inne znaki niealfanumeryczne. Weź zassij choćby regexp editor stąd i sam sprawdź

http://www.waterproof.fr/products/RegExpEditor/

Mesajah

3.03.2011, 09:37:24

No rzeczywiście chyba się za dobrze nie przyjrzałem (późno było), ale teraz już wszystko kapuje.
Nie wiem co z moim parserem, ale musiałem dodać linijki str_replace, żeby mi usunął pewne znaki, bo inaczej
nie zamieniał ich.
Co do escapowania to nie robiłem tego, nawet nie wiem w którym momencie miałbym to robić, czy w tym kodzie który podałem,
czy w jego argumentach (a tego raczej już bym nie chciał zmieniać).

Spróbuje zastąpić moją regułę:

[PHP] pobierz, plaintext 
$string = preg_replace('/[^0-9a-z\-]+/', '', $string);
[PHP] pobierz, plaintext

Tą której Ty używasz:

[PHP] pobierz, plaintext 
$title = preg_replace('/[^'.$separator.'a-z0-9\s]+/', '', strtolower($title));
[PHP] pobierz, plaintext

Aczkolwiek dziwne, że ta moja nie usuwa tego co powinna, skoro mówisz, że u Ciebie nie ma z tym problemu...

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.