Takowy robot nie jest trudny do zrobienia.
Pobieramy dane ze strony najlepiej cURL em.
Następnie wyrażeniem/ami regularnymi wyszukujemy i "wypluwamy" do tablicy elementy dla nas najpotrzebniejsze (cena, data, itp itd).
Czasami trzeba wybrać z jednej strony linki do produktów i dopiero na stronie danego produktu wyszukać w/w informacji. Należy wtedy z pierwszej strony wybrać same linki i zwrócić je w tablicy, następnie (ciągle cURLem) poszukujemy na stronach potrzebnych nam informacji i ponowie zapisać je do tablicy.
Na koniec zostaje nam zapisanie wszystkiego do pliku można użyć funkcji implode (o ile wygląd nie jest skomplikowany). Do zapisania pliku może się przydać funkcja file_put_contents.
Poniżej są przykłady prostych robotów, jeden działa na cURL drugi na file_get_contents
Kod
http://peb.pl/1427157-post11.html
http://peb.pl/1966434-post2.html
Zapoznaj się z podstawami wyrażeń regularnych oraz ich implementacji w php.