Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [PHP]Regex linka bez http - google
Forum PHP.pl > Forum > Przedszkole
Watt
Witam,


Słabo się znam na wyrażeniach regularnych i nie jestem w stanie sam tego sobie napisać. Google blokuje na swoim api gdy chcę pobrać 100 wyników, dlatego też chciałem skopiować 10 pierwszych stron do pliku, a później sprawdzić to preg machem. Niestety linki z google nie mają http (zacznają sie od www, albo bez www) i nie wiem jak je skopiować

Próbowałem coś pisać, sam ale nie znam się na tym na tyle, żeby coś napisać z sensem
Kod
preg_match('/[^\n]*(.*).pl[^<]*/isU', $t,$t2);
sajegib
  1. $pattern = '/^(www\.)?[a-z0-9_\-]+.[a-z]+$/';
  2. $subject = twoj_string_do_sprawdzenia;
  3.  
  4. preg match($pattern, $subject);


ale zalecam użyć preg_match_all w twoim wypadku
Watt
Zrobiłem tak i niestety nie działa. (Może zle opisałem to co chciałem uzyskać)

Kod
        //dla hasla trescgoogle
        $body="Analityka treści w Google Analytics ? Google Analytics
            www.google.com/intl/pl_ALL/analytics/features/content.html?
            Znajdź w swojej witrynie najlepsze treści i ukryte skarby dzięki raportom Google Analytics dotyczącym treści.
            Zgłaszanie treści do Google
            www.google.com/intl/pl/submit_content.html?
            Dodaj adres URL do indeksu Google Aktualizujemy lub dodajemy witryny internetowe do naszego indeksu za każdym razem, gdy przemierzamy sieć.
            Usuwanie treści z Google - Google - Pomoc
            support.google.com/bin/static.py?hl=pl&ts=1114905&page=ts.cs?
            Usuwanie treści z Google. To narzędzie umożliwia wykonanie procedury zgłoszenia materiałów, które Państwa zdaniem w świetle obowiązującego prawa ...
            Ustawienie Kontrowersyjna treść - Google Apps - Pomoc
            support.google.com/a/bin/answer.py?hl=pl&answer=1346936?
            Ustawienie Kontrowersyjna treść umożliwia określenie operacji wykonywanych na wiadomościach na podstawie utworzonych list słów. Zasady dotyczące ...";
            preg_match_all('/^(www\.)?[a-z0-9_\-]+.[a-z]+$/', $body, $match);
        
        print_r($match);


Zwraca
Kod
Array ( [0] => Array ( ) [1] => Array ( ) )


Próbowałem dawac też do osobnego pliku i wczytywać file_get_contents zwraca niestety to samo.
sajegib
  1.  
  2. $pattern = '/(.*)(www\.)?[a-z0-9_\-]+\.[a-z]+(.*)/';
  3.  
  4. preg_match_all($pattern, $body, $out);


daje następujący $out

  1.  
  2. Array ( [0] => Array ( [0] => www.google.com/intl/pl_ALL/analytics/features/content.html? [1] => www.google.com/intl/pl/submit_content.html? [2] => support.google.com/bin/static.py?hl=pl&ts=1114905&page=ts.cs? [3] => support.google.com/a/bin/answer.py?hl=pl&answer=1346936? ) [1] => Array ( [0] => www.google.com/intl/pl_ALL/analytics/features/conten [1] => www.google.com/intl/pl/submit_conten [2] => support.google.com/bin/static.py?hl=pl&ts=1114905&page=t [3] => support.google.com/a/bin/answe ) [2] => Array ( [0] => [1] => [2] => [3] => ) [3] => Array ( [0] => ? [1] => ? [2] => ? [3] => ?hl=pl&answer=1346936? ) )
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.