Kilka dni temu zainteresowałem się php, a dokładniej wyrażeniami regularnymi i postanowiłem sobie skleić mały skrypt przy użyciu manuala i tego forum. Problem w tym, że ładuje się on około 4 sekund i w związku z tym mam kilka pytań.
1. Jeśli mam możliwość uzyskać wynik przez get_headers() to z niego jest lepiej wyciągać wyrażeniami regularnymi (przykład Validator) czy też pobrać cały kod strony(przykład google) i tam dopiero zastosować wyrażenia? Osobiście wydaje mi się, że lepiej zadziała get_headers() bo pobiera tylko małą ilość informacji, a w przypadku kodu jest tego o wiele więcej.
2. Czy php nadaje się do tego aby wyciągać dane np. ze 100 stron? Bo jest kilkaset stron opartych o jeden skrypt i chciałbym kilka danych z każdej strony wyciągnąć i stworzyć sobie taką bazę danych, którą będę aktualizował raz na jakiś czas.
3. Czy są tu jakieś błędy, których ja nie widzę, a spowalniają kod?
Oto kod:
<?php // ************ Adres strony ************** $strona = 'wp.pl'; //adres strony // ********************************** Google ********************************************** $pobieranie2 = file('http://www.google.pl/search?hl=pl&source=hp&biw=1366&bih=641&q=site%3A'.$strona.'&aq=f&aqi=&aql=&oq='); //pobiera site z google i laduje do tablicy /* Tutaj znajduje się kod z jeszcze jednego serwisu ... ... */ //**************** Validator ************************************ $header = get_headers('http://validator.w3.org/check?uri='.$strona.'&charset=%28detect+automatically%29&doctype=Inline&group=0&user-agent=W3C_Validator%2F1.2'); if($header[5] == 'X-W3C-Validator-Status: Valid') { } else { } $ip = gethostbyname($strona); ?>