Forum PHP.pl > [HTML][inne] regex stracenie pustych linii

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [HTML][inne] regex stracenie pustych linii

emanuel

14.05.2011, 22:31:51

Potrzebuje stracić „puste” linie we wczytanym pliku HTML.

Przykładowy kod wejściowy

[HTML] pobierz, plaintext 
</div>
         <div style="clear:both;height: 10px;"></div>
 
         <a name="comments"></a>
	<div id="vk_comments"></div>
				<script type="text/javascript">
						<!--
						if (/*@cc_on 1 | @*/ 0) {
							addLoadEvent(function(){
								VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381);
							});
						} else {
							VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381);
						}
						//-->
					</script>
 
					<!--<div id="disqus_thread"></div>
					<script type="text/javascript">
					  /**
[HTML] pobierz, plaintext

Po straceniu pustych linii ma być tak

[HTML] pobierz, plaintext 
</div>
                    <div style="clear:both;height: 10px;"></div>
                    <a name="comments"></a>
					<div id="vk_comments"></div>
					<script type="text/javascript">
						<!--
						if (/*@cc_on 1 | @*/ 0) {
							addLoadEvent(function(){
								VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381);
							});
						} else {
							VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381);
						}
						//-->
					</script>
					<!--<div id="disqus_thread"></div>
					<script type="text/javascript">
					  /**
[HTML] pobierz, plaintext

W powyższym fragmencie kodu stracono dwie puste linie. Puste linie mogą nie być puste. W liniach mogą być niewidoczne znaki (tabulator, spacja) a linia zakończona znakami LR lub LR i CR.
Możliwy jest też blok pustych linii w którym będzie wiele pustych linii jedna pod drugą.
Niewidoczne znaki mogą być zapisane naprzemiennie (np. spacja, tabulator, spacja).

Jednym z pomysłów jest procedura znajdź i zamień z wykorzystaniem regex'u.
Teraz potrzebuję regex'u filtrującego znajdź i wartości zamień, które mógłbym wykorzystać w skrypcie PHP, PERL, lub programach znajdź i zamień przeszukujących pliki.
Ewentualnie podpowiedzi efektywniejszego czasowo i obliczeniowo rozwiązania.
Format kodu wejściowego nie jest znany żeby dobywać dane pomijając puste linie.

Kookaburra

15.05.2011, 10:53:40

Dzień dobry.

Może takie coś okaże się przydatne:

[PHP] pobierz, plaintext 
preg_replace("/(^[\r\n]*|[\r\n]+)[\s\t]*[\r\n]+/", "\n", $string)
[PHP] pobierz, plaintext

Pozdrawiam,
K.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.