Jakieś 4 lata temu zadałem sobie to samo pytanie. Ale kiedy przeglądałem swoje badania, w końcu przeczytałem, że oprócz tego, że zatrudniają najlepszych z najlepszych, aby wymyślić niektóre z najbardziej wyrafinowanych algorytmów wyszukiwania i tak dalej.
Myślę, że jeden z kluczowych projektów, z których korzystali, jest podobny do pomniejszenia mapy. Na farmach masz dużo tanich komputerów. Niech te komputery mają tylko około 80 gigabajtów miejsca na dysku twardym i naciskaj mocno, aby mieć około 16 gigabajtów RAM lub nawet lepiej 32 gig RAM na tych komputerach (jak najwięcej). Pamiętaj, że są one połączone przez jakiś skomplikowany system, który zaprojektowali. Ale kluczową ideą jest to, że po przesłaniu zapytania jest ono przekazywane do ich systemu, w którym spróbuje przeszukać świeże dane w pamięci RAM. Pamiętaj, że mają wiele takich tanich komputerów. A ponieważ dane znajdują się w pamięci RAM, można je znaleźć znacznie szybciej niż na dysku twardym. Ale nie zapominaj, że mają również zaawansowany system (indeksowanie i wszystkie te algorytmy), który bardzo pomaga.
Te dane nie muszą być świeże, ponieważ wszyscy wiemy, że Google przechowuje wszystko. Jeśli chodzi o to, co powinno znajdować się w pamięci RAM, można zastosować tę samą zasadę z drzewkami splay, zachować to, co ludzie najczęściej szukają w pamięci RAM, i spuść najmniej wyszukiwane rzeczy na dysk twardy.
Ten mały pomysł w połączeniu z ich indeksowaniem i wszystkimi innymi rzeczami, o których wspominali inni w swoich odpowiedziach, może być jednym z powodów, dla których jest szybszy niż wyszukiwanie na dysku twardym.
- Moc przewidywania na podstawie innych wyszukiwań.
- Dane najprawdopodobniej znajdują się w pamięci RAM, która, jak wszyscy wiemy, jest szybsza.
- Używaj wielu systemów do dzielenia i podbijania
- Wyszukiwanie jest ich głównym priorytetem.
Oczywiście mogłem się mylić, ale to miało dla mnie sens. I byłem zadowolony z tego, czego się nauczyłem.