Przykładowy kod wejściowy
</div> <script type="text/javascript"> <!-- if (/*@cc_on 1 | @*/ 0) { addLoadEvent(function(){ VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381); }); } else { VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381); } //--> </script> <!--<div id="disqus_thread"></div> <script type="text/javascript"> /**
Po straceniu pustych linii ma być tak
</div> <script type="text/javascript"> <!-- if (/*@cc_on 1 | @*/ 0) { addLoadEvent(function(){ VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381); }); } else { VK.Widgets.Comments('vk_comments', {width: 0, limit: 15}, 1025381); } //--> </script> <!--<div id="disqus_thread"></div> <script type="text/javascript"> /**
W powyższym fragmencie kodu stracono dwie puste linie. Puste linie mogą nie być puste. W liniach mogą być niewidoczne znaki (tabulator, spacja) a linia zakończona znakami LR lub LR i CR.
Możliwy jest też blok pustych linii w którym będzie wiele pustych linii jedna pod drugą.
Niewidoczne znaki mogą być zapisane naprzemiennie (np. spacja, tabulator, spacja).
Jednym z pomysłów jest procedura znajdź i zamień z wykorzystaniem regex'u.
Teraz potrzebuję regex'u filtrującego znajdź i wartości zamień, które mógłbym wykorzystać w skrypcie PHP, PERL, lub programach znajdź i zamień przeszukujących pliki.
Ewentualnie podpowiedzi efektywniejszego czasowo i obliczeniowo rozwiązania.
Format kodu wejściowego nie jest znany żeby dobywać dane pomijając puste linie.