lekosm2
13.01.2018, 09:14:33
Jakim wyrażeniem mogę na stronie
https://regexr.com/ wyciągnąć tylko linki z tekstu?
trzczy
13.01.2018, 09:41:46
SmokAnalog
13.01.2018, 15:18:50
Odpowiedź na to pytanie brzmi: nie ma idealnego wzorca do wyciągania URL-i, bo standard URL jest skomplikowany. Najlepsze co możesz zrobić, to poszukać w Google "url regex" i samemu wybrać taki, który jest Twoim zdaniem wystarczający. Ja raczej nie stosuję tych długaśnych, bo nie za bardzo widzę powód. Jak coś się zaczyna od protokołu i potem w miarę wygląda jak URL, to jestem skłonny przygarnąć to do rodziny rzekomych URL-i. A że mogą się zdarzyć przebierańcy, no cóż.
Powiedz jeszcze skąd wyciągasz te URL-ki. Jeśli z artykułów czy książek, to już na pewno nie warto się bawić w skomplikowane wzorce, bo raczej nikt tam nie wrzucił prawie-URL-a. Jeśli z jakiegoś źródła HTML, to zastanów się czy raczej nie chodzi Ci o wyciągnięcie atrybutów href z HTML-a. Wtedy zabrałbym się do tego zupełnie inaczej.
Podsumowując: daj więcej szczegółów, to obmyślimy jakąś wystarczająco dobrą strategię.