goodgod261
13.02.2010, 17:40:43
Witam!
Mam nietypowy problem - chcę pobierać strony z różnych serwerów i wykonywać skrypty JS na swoim serwerze, a następnie odsyłać gotowe wyniki do kogoś, kto przegląda moją stronę. Aby uprościć sprawę powiedzmy, że chodzi o zrobienie web proxy, chociaż to nie do końca prawda. Czy to możliwe? Jeśli tak, jak to zrobić?
Dodam, że jestem raczej newbie.
I nie pytajcie, czemu chcę to robić, bo to trochę zagmatwana sprawa...
erix
13.02.2010, 19:36:44
Cytat
I nie pytajcie, czemu chcę to robić, bo to trochę zagmatwana sprawa...
A ja właśnie zapytam, bo wykonanie tego co chcesz bez dedykowanego serwera raczej nie przejdzie.
Zachciało Ci się proxy do serwisów z plikami?
goodgod261
13.02.2010, 20:01:18
Ehh... Chcę wyśledzić linki z reklam generowanych skryptami JS. I, wbrew pozorom, wcale nie po to, żeby zrobić bota
Zrobiłbym mechanizm przeszukujący skrypt gdyby nie to, że zależy mi na obsłudze wszelkich możliwych reklam (nie licząc flashowych) - i o ile ze statycznymi linkami nie byłoby problemu, o tyle przy tych generowanych przez JavaScript wymiękam.
erix
13.02.2010, 20:23:51
90% że bez czegoś dedykowanego tego nie zrobisz.
Agares
14.02.2010, 18:44:28
Musisz po prostu znaleźć(ciężko będzie) lub napisać(jeszcze ciężej) parser JavaScriptu.
goodgod261
14.02.2010, 22:53:43
Gdzieś już chyba coś takiego widziałem, ale pojawiają się 2 problemy:
1. Nie wiem, jak duże będzie zainteresowanie stroną, którą robię, ale może być spore, więc lepiej byłoby, żebym miał to na swoim serwerze, a żeby tak było musiałbym sam to napisać albo odkupić, a mam ograniczone fundusze :/
2. Zwykle trzeba przemielić kilka plików JS, a jeśli są połączone bez podania pełnej ścieżki serwera itd. - musiałbym najpierw wyszukiwać gdzie są ścieżki i podmieniać je na bezwzględne, a dopiero potem parsować skrypty, a szukam jakiegoś protego, przejrzystego rozwiązania...
Serwer dedykowany może i bym wynajął, ale nawet nie wiem, jak mam się dogadać... ("Witam, potrzebuję takiego fajnego magicznego serwera, który pobierając strony od razu wykonuje skrypty JS...")
ucho
15.02.2010, 09:42:43
Java ma od 6.0 wbudowany silnik Rhino ale to raczej za wiele nie pomoże - do wykonywania 99% skryptów ze stron potrzebne są obiekty window, document( w tym cały model DOM) - tyle roboty, że jak skończysz i dodasz np WebKita to dostaniesz przeglądarkę internetową

Nawet twórcy takiego JDownloadera czy SkipScreen postawili na robienie konkretnych obejść dla każdej strony zamiast wykonywać skrypty JS.
Fifi209
15.02.2010, 09:48:56
Cytat(ucho @ 15.02.2010, 09:42:43 )

Java ma od 6.0 wbudowany silnik Rhino ale to raczej za wiele nie pomoże - do wykonywania 99% skryptów ze stron potrzebne są obiekty window, document( w tym cały model DOM) - tyle roboty, że jak skończysz i dodasz np WebKita to dostaniesz przeglądarkę internetową

Nawet twórcy takiego JDownloadera czy SkipScreen postawili na robienie konkretnych obejść dla każdej strony zamiast wykonywać skrypty JS.

@topic
Pobierając na swój serwer, możesz po prostu pobrać całą stronę + skrypty i otworzyć np. w FX czy Operze.
goodgod261
15.02.2010, 18:00:50
Cytat(fifi209 @ 15.02.2010, 09:48:56 )

Pobierając na swój serwer, możesz po prostu pobrać całą stronę + skrypty i otworzyć np. w FX czy Operze.

i w czym mi to pomoże? ja chcę sprawdzać, jaki kod HTML wygeneruje mi JS, a następnie poddać go dalszej obróbce, a wszystko musi się dziać automatycznie i zajmować możliwie jak najmniej procka