Zwariowany
30.06.2009, 23:57:51
Jak myślicie jakiej bazy danych używa google, i jakim cudem tak szybko pojawiają nam się wyniki wyszukiwań?
sowiq
1.07.2009, 08:50:53
Pół minuty wyszukiwania w Google i proszę:
Webhosting.pl:
Cytat
Wygląda na to, że Google przygotowuje się do udostępnienia BigTable'a – swojego wewnętrznego systemu bazodanowego – jako usługi sieciowej. W ten sposób baza danych, na której bazuje największa wyszukiwarka na świecie, stanie się bezpośrednią konkurencją dla coraz popularniejszej usługi Amazona – SimpleDB.
BigTablePamiętaj tylko, że do tego rodzaju działalności (jak wyszukiwarka Google) nie wystarczy 'baza danych'. To są systemy rozproszone na kilkadzeisiąt/set/tysięcy? maszyn. Nikt raczej nie potrzebuje takich rozwiązań, więc G pisze je sobie samo na własny użytek.
Przynajmniej tak to sobie tłumaczę. A jak jest na prawdę wiedzą pewnie tylko pracownicy.
Zwariowany
1.07.2009, 08:57:17
a jak to możliwe, że wpisuje słowo i wynik od razu mam? przecież to do przeszukania czasem miliardy stron ...
nie zagłębiałem się w temat, ale podejrzewałbym rodzaj cache... przechowywany zapewne w pamięci.
I do tego pamiętaj, że Google posiada niewyobrażalną ilość maszyn do obsługi tego, to nie jest byle serwer
Tak, cache w RAM-ie. Te maszyny nie są prawie wcale resetowane.
Darti
4.07.2009, 20:29:35
zauważ ze nie dostajesz od razu wszystkich wyników tylko te najszybciej wyszukane (pierwsze z brzegu). To jak wejść do archiwum o rozmiarach boiska pełnego teczek z danymi w celu dostania dwóch - bierzesz te, które są z brzegu i otwierasz a w tle baza się porządkuje i przestawia podobne teczki tych. ktore wziąłeś bliżej wejścia (jak nastepni wejdą to znajdą już bardziej przybliżone dane).
www.aukcje.fm
20.10.2012, 20:28:16
Erix jak w ramie można trzymać tyle stron? Imdexujemy od niedawna polski net i to są ogromne ilości danych, taki backup stron internetowych, nie można tego trzymać w ramie.
hehe jak zaczniecie szukać słów których nie ma zobaczycie że google to jeden wielki słownik. Będzie wam na siłę wmuszał szukanie swoich słów z mega słownika słów które ma ustalone. Zapomnijcie o szukaniu w google w trybie online. Tam dosłownie nie ma takiego czegoś jak szukanie online. Tam każde słowo jest dobrane do słownika, dla niego są algorytmy błędnej pisowni, synonimy, odmiana na osoby,. przypadki, liczby. Każde słowo pewnie ma swój numer i szuka w siatce dla konstrukcji ala tree lub indexuje wszystko binarnie i tak naprawdę ma swoją rzeczywistość i nawet nie wie czego szukamy bo ma swoje odwzorowanie dla szukania tak wyrąbane w kosmos, ale oparte o słownik, słownik to podstawa. A i nie da rady aby wyniki były chociaż w 1 % inne miejscami, chyba że cron google przejdzie po frazach i od nowa ustawi całość, jedne domeny nagle spadają drugie pną się do góry. Cronują maksymalnie i mają filtr ludzki dla top 10 - 30 dla popularnych słów (dostałem info z pewnego źródła dla naszej domeny) a już napweno na ścisłe top dla ultra popularnych fraz któe nie mogą się zmieniać. Nie może być np na pierwszym miejscu dla frazy allegro inny serwis niż allegro bo został ładnie wypozyjonowany, nie chodzi o allegro ale o większość fraz wysoce szukanych które mają swoją moderację ręczną, bo nie może bot wyliczyć że mogło by być inaczej. Dochodzi również klikalność w linki, jako pewnego rodzaju ukryty sondaż, ta domena lepsza dla tej frazy bo więcej osób na nią klika. Dla mieszanki słów jako frazy mają znaczenie wyniki dla pojedynczych słów, jako mnożnik w całości algorytmu, uzależniony od natężenia SEO. Wiele do opowiadania ale już starczy bo google się obrazi i znów napisze list do nas z uwagami.