Forum PHP.pl > [PHP]Czyszczenie kodu html

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP]Czyszczenie kodu html

piotr485

17.06.2016, 16:19:24

Witam.

Mam zmieną $index a w niej całą zawartość strony

$index = '
<html>

<head>
<title>tytuł</title>
</head>

<body>
<div>tekst na stronie</div>
</body>

</html>
';

chciałbym usunąć spacje które są po za obszarami <>

czyli chciałbym uzyskać taki efekt

$index = '<html><head><title>tytuł</title></head><body><div>tekst na stronie</div></body></html>';

czy jest do tego jakaś gotowa funkcja w php ?

Z góry dziękuję za pomoc

Lord

17.06.2016, 18:17:22

http://php.net/manual/en/function.str-replace.php

[PHP] pobierz, plaintext 
// Order of replacement
$str     = "Line 1\nLine 2\rLine 3\r\nLine 4\n";
$order   = array("\r\n", "\n", "\r");
$replace = '';
 
// Processes \r\n's first so they aren't converted twice.
$newstr = str_replace($order, $replace, $str);
 
[PHP] pobierz, plaintext

piotr485

17.06.2016, 18:24:52

prawie działa z tym, że zostają spacje:

[HTML] pobierz, plaintext 
<!DOCTYPE html><html lang="pl">  <head>
[HTML] pobierz, plaintext

i z przodu zmiennej też jest kilka lini przerwy i po znakach również - funkcja trim niestety ich nie czyści, ktoś ma jakiś pomysł ?

trueblue

17.06.2016, 19:30:06

[PHP] pobierz, plaintext 
preg_replace('/^\s+|\n|\r|\s+$/','',$index);
[PHP] pobierz, plaintext

LowiczakPL

17.06.2016, 19:39:44

Kod

function czysc_html($html) {
    $search = array('/\>[^\S ]+/s', '/[^\S ]+\</s', '/(\s)+/s');
    $replace = array('>','<','\\1');
    $html = preg_replace($search, $replace, $html);
    return $html;
}

piotr485

17.06.2016, 20:41:13

hmmm dziwne bo nadal zostają szpary

[HTML] pobierz, plaintext 
 
 
 
 
<!DOCTYPE html><html lang="pl"> <head> <title>Tytuł strony</title> <meta charset="UTF-8">
[HTML] pobierz, plaintext

nie mówiąc o tej przerwie początkowej na 5 lini

LowiczakPL

17.06.2016, 20:46:48

a teraz

[PHP] pobierz, plaintext 
function kompresuj_html($html) {
    $search = array('/\>[^\S ]+/s', '/[^\S ]+\</s', '/(\s)+/s');
    $replace = array('>','<','\\1');
    $html = preg_replace($search, $replace, $html);
    $html = str_replace('> <', '><', $html);
    return $html;
}
[PHP] pobierz, plaintext

piotr485

17.06.2016, 22:05:53

jo teraz super tylko żeby usunąć jeszcze te wiersze początkowe i końcowe ...

com

17.06.2016, 23:07:12

prościej było zapisać ten kod jak należy

LowiczakPL

18.06.2016, 08:10:11

[PHP] pobierz, plaintext 
    function kompresuj_html($html) {
        $search = array('/\>[^\S ]+/s', '/[^\S ]+\</s', '/(\s)+/s');
        $replace = array('>','<','\\1');
        $html = preg_replace($search, $replace, $html);
        $html = str_replace('> <', '><', $html);
        $html = ltrim($html);
        $html = rtrim($html);
        return $html;
    }
[PHP] pobierz, plaintext

piotr485

18.06.2016, 18:40:26

o idealnie teraz z tym, że spacje i nowe linie z przodu <html i tyłu </html> się nie usuneły - dziwna sprawa

trueblue

18.06.2016, 18:54:30

http://forum.php.pl/index.php?s=&showt...t&p=1194376

Crozin

19.06.2016, 01:16:06

1. Zdajesz sobie sprawę, że wynikowy dokument HTML będzie różnił się (strukturalnie, nie w zapisie) od oryginału? A to będzie miało spory wpływ na np. wygląd strony.
2. Jeżeli robisz to w celu zmniejszenia wielkości dokumentu - wykorzystaj kompresję, np. GZIP.

piotr485

19.06.2016, 08:37:53

Cytat(Crozin @ 19.06.2016, 02:16:06 )

1. Nie rozumiem tego stwierdzenia - usuwają się tylko niepotrzebne spacje więc strona ma taki sam wygląd.
2. Zamiast robić echo to trzymam całą stronę w zmiennej i potem traktuje ją tą funkcją w celu optymalizacji - dokładnie tak - więc nie wiem po co by do tego wykorzystywać jakąś bibliotekę?

viking

19.06.2016, 08:45:05

Jeśli np usuniesz spacje pomiędzy elementami listy inline znikną odstępy.
Kompresję zazwyczaj ustawia się na poziomie konfiguracji serwera.

LowiczakPL

19.06.2016, 09:31:48

Ja z automatu kompresuję wynikowy kod HTML i nie zauważyłem aby kiedykolwiek miało to jakikolwiek wpływ na wygląd strony.

Dodatkowo mam włączoną kompresję, plus expires plików.

viking

19.06.2016, 10:47:35

[PHP] pobierz, plaintext 
$html = '<p><span>testowy</span> <a href="#">link</a></p>';
echo $html;
echo kompresuj_html($html);
[PHP] pobierz, plaintext

Gdzie kompresuj_html to post #10

Crozin

19.06.2016, 13:17:08

@piotr485: http://www.oracle.com/technetwork/articles...ace-092897.html - dotyczy XML-a, ale HTML jest pod tym względem podobny. Dołącz do tego kwestie takie jak wyświetlanie bądź nie odstępów pomiędzy elementami liniowymi czy interpretowanie białych znaków przez CSS-owe właściwości typu white-space. Poza tym porównaj sobie wielkość skompresowanego GZIP-em (Google: Apache/Nginx/dowolny-serwer html gzip compression) "zaśmieconego" i ręcznie "oczyszczonego" HTML-a - zapewne różnice będą skrajnie małe. Na koniec: jeżeli już tak bardzo by Ci zależało na takim wyglądzie finalnego dokumentu zastanów się nad wykorzystaniem jakiegoś systemu szablonów operujących na XML-u. Weź pod uwagę fakt, że poniższy kod jest poprawnym HTML5 a wszystkie "optymalizatory" bazujące na wyrażeniach regularnych zmodyfikują Ci błędnie zawartość atrybutu title:

[HTML] pobierz, plaintext 
<img src="image.png" title="some > image < xxx" alt="xx">
[HTML] pobierz, plaintext

LowiczakPL

19.06.2016, 15:04:09

<img src="image.png" title="some > image < xxx" alt="xx">

Moje eregi zostawiają Twój przykład w stanie nienaruszonym

---------------------------
Tu akurat się rozpędziłem i przegiąłem w linii 5, która jest do wywalenia bo ona popsuje niestety strony.

Cytat(viking @ 19.06.2016, 11:47:35 )

[PHP] pobierz, plaintext 
$html = '<p><span>testowy</span> <a href="#">link</a></p>';
echo $html;
echo kompresuj_html($html);
[PHP] pobierz, plaintext

Gdzie kompresuj_html to post #10

com

19.06.2016, 18:51:11

Już Ci napisałem, zapisuj to poprawnie i nie kombinuj, bo więcej kosztuje Cie prze-renderowanie tego niż uzycie sugerowanego gzipa albo zapisanie to bez zbędnych białych znaków, dodatkowo od czegoś jest heredoc/nowdoc

Pyton_000

20.06.2016, 11:42:56

Testuj sobie.... http://stackoverflow.com/questions/6225351...age-html-output

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.