Kod
/(?:(?:https?|ftp):\/\/|www\.)[-a-z0-9+&@#\/%?=~_|!:,.;]*[-a-z0-9+&@#\/%=~_|]/i
Którego zadaniem jest wyszukiwanie linków, i wszystko ładnie pięknie działa, z tym że znajduje również adresy których nie chcę w tym np:
Cytat
http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd
http://www.w3.org/1999/xhtml
http://gmpg.org/xfn/11
http://www.exploit-media.eu/wp-content/the.../css/screen.css
http://www.w3.org/1999/xhtml
http://gmpg.org/xfn/11
http://www.exploit-media.eu/wp-content/the.../css/screen.css
I moje pytanie brzmi jak przekształcić to wyrażenie tak aby znajdowało podstrony, ale pomijało linki do obrazków, styli css itp oraz jak zrobić aby znajdywało same domeny i subdomeny bez podstron np
Cytat