Forum PHP.pl > [PHP] wyszukiwarka .txt usunięcie powtórzeń

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP] wyszukiwarka .txt usunięcie powtórzeń

wujekk13

5.10.2012, 12:57:44

Na podstawie znalezionych dotąd skryptów udało mi się ułożyć prostą wyszukiwarkę, niestety zauważyłem w niej dwa mankamenty. Po pierwsze dublują mi się wyniki wyszukiwania. Chciałbym prosić forumowiczów o pomoc w usunięciu powtarzających się wyników, tak by link, który odnosi się do konkretnych fragmentów zapytania (chodzi o zapytania składające się z więcej niż jednego słowa/fragmentu słów) wyświetlał się tylko raz, a nie kilka razy.

Podaję kod dla pliku wyszukiwarkatxt2.php:

[PHP] pobierz, plaintext 
<?php header('Content-Type: text/html; charset=utf-8'); ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
   <meta http-equiv="content-type" content="text/html; charset=utf-8">
  <title>Wyszukiwarka oparta na plikach tekstowych - ITPorady.pl</title>
</head>
<body>
 
<form action="" method="post">
<input type="text" name="wyszukiwarka"/>
<input type="submit" value="Szukaj" />
</form>
 
<?php
function str2url( $str, $replace = "-" ){
 
    // konwersja znaków utf do znaków podstawowych
    $str = iconv('UTF-8', 'ASCII//TRANSLIT', $str);
 
    // Niektóre francuskie i niemieckie litery pozostawiają po takiej konwersji (jak powyżej)
    // dodatkowe znaki. Poniższe dwie linijki te znaki wycinają
 
    $charsArr = array( '^', "'", '"', '`', '~');
    $str = str_replace( $charsArr, '', $str );
 
    $return = trim(preg_replace('# +#',' ',preg_replace('/[^a-zA-Z0-9\s]/','',strtolower($str))));
    return str_replace(' ', $replace, $return);
    }
?>
 
<?php
 
 
$bl=false;
 
if(isset($_POST['wyszukiwarka']) && $_POST['wyszukiwarka']!=''){
$wyszukiwarka = $_POST['wyszukiwarka'];
 
$dane = file('dane.txt');
echo "<ul>\n";
foreach($dane as $key){
$g = explode(' | ', chop($key));
$gie = explode(' ', $wyszukiwarka);
$ile = count($gie);
for ($fi=0; $fi <$ile; $fi++){
if(stripos(str2url($key), str2url($gie[$fi]))){
   echo '<a href="'.$g[0].'" title="'.$g[2].'">'.$g[1]."</a>\n<br>"; //strtolower() - zmienia na małe litery cły tekst/ strtoupper()- zmienia na duże cały tekst/ generują krzaczki zamiast polskich znaków
   $bl = true;
}
}
}
//echo '</ul>';
if(!$bl) echo 'nie znaleziono podanej frazy: ' .$wyszukiwarka;
}
 
?>
 
 
</body>
</html>
[PHP] pobierz, plaintext

oraz kod pliku z danymi dane.txt:

[HTML] pobierz, plaintext 
firma.html | f zobacz co proponujemy | hasło nowe inne 0
inne.html | i Mapa dojazdu - zobacz jak do nas dojechać | słowa kluczowe
rura.html | r Witam Witam  Witam  Witam | bla bla
kontakt.html | kontakt - jeżeli masz jakieś pytania - pisz śmiało! | coś tam innego
[HTML] pobierz, plaintext

Drugi problem jest związany z samym wyszukiwaniem, gdy za pierwszym znakiem "|" mam nazwę taką jak w linku np. "kontakt" to do zapytania "kont" otrzymuję wynik: "nie znaleziono podanej frazy: kont" ale jeśli zapytam o "onta" to otrzymuję link do szukanej strony, czyli do kontakt.html
Ma ktoś może jakiś pomysł dlaczego się tak dzieje i jak można to rozwiązać?

Na wstępie powiem, że nie wiem jak to edytować, żeby dodać poprawki.
Udało mi się zmusić skrypt do generowania wyników wyszukiwania bez powtórzeń oto kod:

[PHP] pobierz, plaintext 
 
<?php header('Content-Type: text/html; charset=utf-8'); ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
   <meta http-equiv="content-type" content="text/html; charset=utf-8">
  <title>Wyszukiwarka oparta na plikach tekstowych - ITPorady.pl</title>
</head>
<body>
 
<form action="" method="post">
<input type="text" name="wyszukiwarka"/>
<input type="submit" value="Szukaj" />
</form>
 
<?php
function str2url( $str, $replace = "-" ){
 
    // konwersja znaków utf do znaków podstawowych
    $str = iconv('UTF-8', 'ASCII//TRANSLIT', $str);
 
    // Niektóre francuskie i niemieckie litery pozostawiają po takiej konwersji (jak powyżej)
    // dodatkowe znaki. Poniższe dwie linijki te znaki wycinają
 
    $charsArr = array( '^', "'", '"', '`', '~');
    $str = str_replace( $charsArr, '', $str );
 
    $return = trim(preg_replace('# +#',' ',preg_replace('/[^a-zA-Z0-9\s]/','',strtolower($str))));
    return str_replace(' ', $replace, $return);
    }
?>
 
<?php
 
 
$bl=false;
 
if(isset($_POST['wyszukiwarka']) && $_POST['wyszukiwarka']!=''){
$wyszukiwarka = $_POST['wyszukiwarka'];
 
$dane = file('dane.txt');
echo "<ul>\n";
foreach($dane as $key){
$g = explode(' | ', chop($key));
$gie = explode(' ', $wyszukiwarka);
$ile = count($gie);
for ($fi=0; $fi <$ile; $fi++){
if(stripos(str2url($key), str2url($gie[$fi]))){
 
$wejscie[] = '<a href="'.$g[0].'" title="'.$g[2].'">'.$g[1]."</a>\n<br>";
$tab = array_unique(array_merge ($wejscie));
  $bl = true;
}
}
}
if(!$bl) {echo 'nie znaleziono podanej frazy: ' .$wyszukiwarka;}
else
{
$nowe = array_unique(array_merge ($tab));
$n1 = count($nowe);
for ($i=0;$i<$n1; $i++) {
 
            echo ''.$nowe[$i].' ';
 
        }
}
}
 
?>
 
 
</body>
</html>
[PHP] pobierz, plaintext

jednak nadal nie mogę sobie poradzić z drugą częścią mojego pytania.
Jeśli miałby ktoś pomysł jak sprawić by przedstawiony kod był czytelniejszy to proszę o poprawienie.

b4rt3kk

5.10.2012, 13:53:47

Powielone wpisy w tablicy usuniesz funkcją array_unique($array), która zwróci nową tablicę z unikatowymi wartościami.

Natomiast funkcję:

[PHP] pobierz, plaintext 
if(stripos(str2url($key), str2url($gie[$fi])))
[PHP] pobierz, plaintext

proponowałbym zastąpić preg_match:

[PHP] pobierz, plaintext 
$global_matches = array();
 
foreach($dane as $key){
 
$subject = trim($key);
$search = explode(' ', $wyszukiwarka);
 
foreach ($search as $value) {
$pattern = '/\|[^|]*'.$value.'[^|]*\|/';
preg_match ($pattern , $subject, $matches);
foreach ($matches as $key1 => $value1) $matches[$key1] = str_replace('|', '', $matches[$key1]); 
$global_matches[] = $matches;
}
}
[PHP] pobierz, plaintext

i w tablicy $global_matches masz wszystkie zgodne wyniki.

wujekk13

9.10.2012, 08:42:32

@b4rt3kk wybacz, że ponownie zawracam głowę, ale próbuję od dwóch dni ten kod, który mi podałeś zintegrować ze swoimi wypocinami, jednak każda kombinacja kończy się jakimś błędem lub niewyświetleniem wyniku. Mógłbym Cię prosić o jakąś podpowiedź, jak to podmienić? Mam jeszcze pytanie, czy dobrze rozumuję, że powinienem tam dorzucić jeszcze funkcję if, tak by w razie braku dopasowania wyświetlało się, że nie zaleziono poszukiwanej frazy?

b4rt3kk

9.10.2012, 11:58:22

[PHP] pobierz, plaintext 
$bl=false;
 
if(isset($_POST['wyszukiwarka']) && $_POST['wyszukiwarka']!=''){
 
$wyszukiwarka = $_POST['wyszukiwarka']; 
$dane = file('dane.txt');
$global_matches = array();
 
foreach($dane as $key){
 
$subject = trim($key);
$search = explode(' ', $wyszukiwarka);
 
foreach ($search as $value) {
  $pattern = '/\|[^|]*'.$value.'[^|]*\|/';
  preg_match ($pattern , $subject, $matches);
  foreach ($matches as $key1 => $value1) $matches[$key1] = str_replace('|', '', $matches[$key1]); 
  $global_matches[] = $matches;
}
}
 
// tutaj wydrukowanie wyników (roboczo print_r)
 
print_r($global_matches);  // jeszcze należałoby się pozbyć powtórzeń, ale to już wiesz jak
 
// natomiast jeśli tablica pusta to wtedy wyświetlasz, że nie znaleziono wyników
 
}
[PHP] pobierz, plaintext

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.