Forum PHP.pl > Naruszenie zasad ochrony pamieci?

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: Naruszenie zasad ochrony pamieci?

pietrekk

10.03.2010, 11:09:17

Witam,

Mam skrypt, ktory wykorzystuje rekurencje i czasem wywala taki blad na konsoli: "Naruszenie zasad ochrony pamieci".
Ktos wie w czym moze tkwic problem albo jak to mozna sprawdzic?

i druga kwestia czy jest jakies rozwiazanie, ktore jesli dzialanie skryptu zostaje przerwane wywoluje inna funkcje/plik ?

nospor

10.03.2010, 11:28:41

rekurencja ma to do siebie, ze zjada duzo pamieci. Jak sie twoja rekurencja dlugo nie konczy to taki jest efekt

pietrekk

10.03.2010, 11:40:18

hmmm czyli jakie rozwiazania mozna zastosowac zeby tego uniknac?

nospor

10.03.2010, 11:42:18

unikac rekurencji jak ognia. A jak sie nie da, to tak ją pisac by bylo optymalnie.
No ale wrozką nie jestem - pokaz kod i co on ma robic.

pietrekk

10.03.2010, 11:51:02

a mozna jakos sprawdzic ile pamieci juz rekurencja pozarla, i np przerwac wykonywanie skryptu zanim zezre wszystko co dostepne i np zwolnic pamiec i uruchomic skrypt od nowa ? (wtedy i tak bedzie kontynuuowal od momentu przerwania bo to operacje na bazie danych );

nospor

10.03.2010, 11:55:39

Cytat

wtedy i tak bedzie kontynuuowal od momentu przerwania bo to operacje na bazie danych

Skoro jestes w stanie kontynuowac, to po co ci ta rekurencja tam? POkaz kod to ci poprawimy

pietrekk

10.03.2010, 12:25:25

to jest taki spider/crawler do np robienia sitemap'y, zrobilem to z wykorzystaniem mysql:

function crawl($domain)
{
//select url not crawled yet
$sql = "SELECT * FROM tmpUrlCrawled WHERE visited IS NULL LIMIT 1";
$result = mysql_query($sql) or die (mysql_error()."<br>Query: $sql");
if(mysql_num_rows($result)>0)
{
$url = mysql_result($result,0,"url");
$url = mysql_real_escape_string($url);
//update url which was crawled
$sql = "UPDATE tmpUrlCrawled set visited = 'y' WHERE url = '$url'";
$result = mysql_query($sql) or die (mysql_error()."<br>Query: $sql");
//crawl links
if(preg_match("/^http[s]?:\/\/[^\/]*".str_replace('.', '\.', $domain)."/i", $url))
{
$tmpLinks = getUrls($url);
$tmpLinks = array_unique($tmpLinks);
}
//add crawled links to DB
if($tmpLinks)
foreach ($tmpLinks as $tmpLink)
{
$tmpLink = mysql_real_escape_string($tmpLink);
$sql = "INSERT IGNORE INTO tmpUrlCrawled set url = '$tmpLink'";
$result = mysql_query($sql) or die (mysql_error()."<br>Query: $sql");
}
//rekurencja
crawl($domain);
}

}

thek

10.03.2010, 12:49:06

Tutaj rekurencja? Ty chyba zgłupiałeś...

Chcesz cały net zaindeksować? Ktoś zrobi motyw http://www.domena.pl?url=http://www.domena2.pl i wlatujesz z crawlerem na całkiem inną domenę. Ewentualnie wpadasz na farmę linków i znów masz dym. Sprawdzaj wpierw czy znajdujesz się nadal na domenie z jakiej wyruszyłeś i sprawdzaj poziom zagłębienia. Bo jak wpadniesz w pętlę przekierowań to się robi potem jazda... A nie widzę byś się zabezpieczał jakkolwiek na taką sytuację. Poza tym myśl trochę przy pisaniu. Robisz dziesiątki zapytań i bazę zarżynasz. A powinieneś wyciągnąć z bazy listę linków aktualnie dla tej strony zaindeksowanych i w pętlach porównywać oznaczając: ta już była, ta jest nowa itd. Bo inaczej robisz sieczkę ostrą.
Do sitemapy Twojej własnej strony wystarcza znajomość jej struktury. Pewne linki masz stałe i możesz je na pałę wpisać do kodu. To co z bazy to zwykłe pętle while i banalne zapytania:

[PHP] pobierz, plaintext 
<?php require_once("danebazy.php");
$content = '<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0....p.xsd">
<url>
  <loc>http://www.domena.pl/</loc>
  <priority>1.0</priority>
  <changefreq>daily</changefreq>
</url>
<url>
  <loc>http://www.domena.pl/kontakt.php</loc>
  <priority>0.5</priority>
  <changefreq>monthly</changefreq>
</url>';
$kategorie = mysql_query( "SELECT * FROM artykuly_kategorie" );
while($wynik = mysql_fetch_assoc( $kategorie ) ) {
$content .= '<url>
  <loc>http://www.domena.pl/kategoria_artykulow_'.string2filename( polskie( $wynik['nazwa'] ) ).','.$wynik['id'].'.php</loc>
  <priority>0.4</priority>
  <changefreq>weekly</changefreq>
</url>
';
}
$artykuly = mysql_query("SELECT tytul, id FROM artykuly WHERE stan = 1");
while($wynik = mysql_fetch_assoc( $artykuly ) ) {
$content .= '<url>
  <loc>http://www.domena.pl/art-'.string2filename( polskie( $wynik['tytul'] ) ).','.$wynik['id'].'.php</loc>
  <priority>0.4</priority>
  <changefreq>weekly</changefreq>
</url>
';
}
$content .= '</urlset>';
fputs($file, $content);
fclose($file);
ping_google();
?>
[PHP] pobierz, plaintext

Tak się to robi, choć ja mocno okroiłem, ale żadne crawlery bo to mocno niewydajne i jedzie zarówno po serwisie, jak i po bazie. Nawet mocno rozbudowane serwisy się tak robi. Tyle, że wtedy robi kilka plików sitemap, nie zaś jeden duży. Ludzie myślcie trochę chociaż...

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.