Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [php] Parsowanie stron
Forum PHP.pl > Forum > Przedszkole
Hubson
Ostatnio zainteresowałem się kwestią wyciągania przeróżnych danych ze stronek www. Taki bajerek przydałby mi się bardzo, jednakże nie wiem jak pobierać owe dane.

Weźmy sobie na przykład (założenie całkiem teoretyczne) wyciąganie informacji o przedmiotach wystawionych w serwisie aukcyjnym Allegro.pl, jakiegokolwiek użytkownika. Jak te dane wyciągnąć?

Czy ktoś zna dobry artykuł opisujący zagadnienie parsowania stron? Może ktoś mógłby mnie tego nauczyć Rkingsmiley.png?

Z góry dziękuję guitar.gif .
maverickkk
http://forum.php.pl/index.php?showtopic=44555&hl=
Hubson
Chyba niedoczytałeś... tam jest przedstawiony gotowiec... Ja chcę napisać coś własnego. Tylko potrzebuję jakieś "how to?". Ów skrypt nie przedstawia wyciągnia danych o przedmiotach, ale dzięki za próbe udzielenia pomocy.
gebp
Hubson. Jeżeli chodzi o php to nie ma za bardzo jak gdyż php jest parsowane (czyt. wykonywane) po stronie serwera (czyt. jest wykonywane przez serwer (komputer który jest serwerem)) i w postaci gotowej wysyłane do przeglądarki klienta w przeciwieństwie do HTML'a.
Dlatego też php jest na tyle bezpieczne że w nim trzyma się np. hasła i loginy do bazy danych.

Żeby wyciągnąć dane musiłbyś włamać się na serwer i zdobyć kod źródłowy danego pliku *.php .

Napisz sobie
  1. <?php
  2. echo ("Hellow word");
  3. ?>

A następnie najlepiej w FF Ctrl+U lub innny podgląd żródła strony.

No chyba że chodziło Ci o coś innego.
Hubson
Chodziło mi o coś innego, nie wyciągniecie kodu php, a informacji ze strony. Spotkałem się też np. ze skryptem wyciągającym informacje o zmianie kursów walut na stronie NBP. Wiem tylko, że takowe skrypty pobierają wyłącznie kod HTML strony i parsują całość w poszukiwaniu określonych danych. Znam podstawy php i nie musisz mi ich tłumaczyć smile.gif.
maverickkk
Skoro masz gotowca podejrzyj jego kod.

A w kursie walut chodzi o czytanie z pliku XML na stronie

http://www.nbp.pl/Kursy/KursyC.html

też sa gotowce nato w sieci.
Hubson
Na podstawie jednego źródła nie nauczę się wszystkiego. Tak jak początkujący nie nauczy się php ściągając z sieci jakikolwiek skrypt i gapiąc się w jego źródło jak sroka w gnat winksmiley.jpg. Tak więc proszę o wskazywanie jakiś tutoriali, a nie gotowych rozwiązań. Dzięki.
Cysiaczek
Zorientuj się jak jest zorganizowany serwis, z którego chcesz pobrać informacje. Teraz.
1. Jesli serwis udostepnie jakieś dane w postaci pliku XML lub txt, to jest to zadanie proste - musisz pobrać te pliki i przetworzyć do postaci Tobie odpowiadającej.

2. Jeśli masz tylko dostęp do strony www, to poprzez (do wyboru) cURL, fsockopen(), file_get_contents() pobierasz stronę i następnie za pomocą wyrażeń regularnych lub interfejsu DOM przetwarzasz dokument html do żądanej postaci. Jest to zadanie czasochłonne i mało wydajne.

3. Czasami serwisy udostępniają możliwość pobrania danych bezpośrednio z bazy danych, wtedy obejdzie się bez parsowania źródeł wygenerowanych przez php.

Pozdrawiam.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.