Zwariowany
15.07.2009, 18:58:27
Chciałbym się was zapytać, jak wyszukiwarki internetowe mogą wg was mieć zapisane strony, że znajdują one odpowiedz na zapytanie w przeciągu sekundy? Jakiej bazy używa np netsprint, czy choćby szukacz? Wiadomo, że google ma BIGTABLE, a mi chodzi o rozwiązania gotowe. Jak wy byście zrobili taką wyszukiwarkę pod kątem bazy danych?
erix
15.07.2009, 19:11:07
Sphinx.
Zwariowany
15.07.2009, 19:21:26
Brzmi ciekawie, mógłbyś coś o tym Spinxie powiedzieć?
erix
15.07.2009, 19:22:17
Zbanowali Ci Google?
Zwariowany
15.07.2009, 19:26:55
Znalazłem już ciekawy artykuł. A teraz dalsza część mojego pytania: Przeszukujemy 210.000.000 stron w polskim Internecie - takie coś ma napisane wyszukiwarka netsprint. Przyjmuje, że każda strona ma średnio 10 podstron. Co daje 2,1 mld stron w bazie (wierszy)

! Czy spinx również to jakoś obsłuży, czy tu jakieś inne rozwiązanie wchodzi w grę?
erix
15.07.2009, 19:29:46
Przejrzyj sobie dobrze stronę, to się dowiesz.
Przy takich ilościach dochodzą dodatkowo zagadnienia replikacji.
Zwariowany
15.07.2009, 19:56:27
tam piszę o 300 tys, a nie o 3mld ;/
erix
15.07.2009, 20:03:03
Ale ja jeszcze o czymś napisałem.
Zwariowany
15.07.2009, 20:42:27
O replikacji, ale nawet jak coś się zreplikuje to to i tak jest co najmniej 2 mld wierszy ...
erix
15.07.2009, 21:03:30
A o memcached słyszał?
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę
kliknij tutaj.