Po pierwsze, to tylko żart i jest niepoprawny. Google ma wielu bardzo utalentowanych statystyk, ekspertów od wyszukiwania informacji, językoznawców, ekonomistów, niektórych psychologów i innych. Ci ludzie spędzają dużo czasu, ucząc wielu niestatystów na temat różnicy między korelacją a przyczyną. Biorąc pod uwagę, że jest to duża organizacja, mogą istnieć kieszenie, nawet duże kieszenie, niewiedzy, ale twierdzenie jest zdecydowanie fałszywe. Co więcej, duża część tej edukacji ma do czynienia z klientami, zwłaszcza z reklamodawcami.
Głębsza odpowiedź: różnica jest niezwykle ważna. Wystarczy spojrzeć na ranking wyników wyszukiwania i pozwolić mi wyjść poza samą „korelację”, aby uwzględnić miary podobieństwa, funkcje oceniania itp. Niektóre strony są oceniane jako dobre wyniki dla niektórych zapytań. Mają różne funkcje predykcyjne, które są ważne dla ich rankingu. W przeciwieństwie do tych dobrych stron, które są dobrymi wynikami dla zapytań, jest to zestaw stron internetowych, które są bardzo złymi wynikami dla tych samych zapytań. Jednak twórcy tych stron poświęcają wiele wysiłku, aby wyglądali jak dobre strony z liczbowego punktu widzenia, takie jak dopasowania tekstowe, łącza internetowe i inne. Jednak fakt, że strony te są liczbowo „podobne” do dobrych stron, nie oznacza, że w rzeczywistości są to dobre strony. Dlatego Google zainwestował i będzie nadal inwestował wiele wysiłku, aby określić, jakie rozsądne funkcje odróżniają (oddzielne) dobre i złe strony.
To nie jest całkiem korelacja i związek przyczynowy, ale jest głębsze. Dobre strony dla niektórych zapytań mogą być odwzorowane w przestrzeni numerycznej, gdzie wyglądają podobnie i różnią się od wielu nietrafnych lub złych stron, ale to, że wyniki znajdują się w tym samym obszarze przestrzeni cech, nie oznacza, że pochodzą z tego samego podzbioru „wysokiej jakości” w sieci.
Prostsza odpowiedź: bardzo prostą perspektywą jest odniesienie się do rankingu wyników. Najlepszy wynik powinien być pierwszy, ale fakt, że coś jest na pierwszym miejscu, nie oznacza, że jest to najlepszy wynik. Według niektórych wskaźników oceny może się okazać, że ranking Google jest skorelowany ze złotym standardem ocen jakości, ale to nie znaczy, że ich ranking sugeruje, że wyniki są naprawdę w tej kolejności pod względem jakości i trafności.
Aktualizacja (trzecia odpowiedź): z czasem pojawia się inny aspekt, który wpływa na nas wszystkich: najwyższy wynik Google może zostać uznany za wiarygodny, ponieważ jest to najlepszy wynik w Google. Chociaż analiza linków (np. „PageRank” - jedna metoda analizy linków) jest próbą odzwierciedlenia postrzeganej autorytatywności, z czasem nowe strony w temacie mogą po prostu wzmocnić tę strukturę linków poprzez link do najlepszego wyniku w Google. Nowsza strona, która jest bardziej autorytatywna, ma problem z przewrotką w stosunku do pierwszego wyniku. Jak Google chce dostarczyć najbardziej odpowiedniej strony w chwili obecnej , wiele czynników, w tym tak zwanym „bogaty-get-bogatsze” zjawisko, wynikać domniemany efekt korelacji na postrzeganą przyczynowości.
Aktualizacja (czwarta odpowiedź): zdałem sobie sprawę (dla komentarza poniżej), że warto przeczytać Alegorię jaskini Platona, aby dowiedzieć się, jak interpretować korelację i związek przyczynowy w wyniku „refleksji / projekcji” rzeczywistości i jak my (lub nasze maszyny) to postrzegamy. Korelacja, ściśle ograniczona do korelacji Pearsona, jest zdecydowanie zbyt ograniczona jako interpretacja problemu nieporozumienia (szerszej niż tylko korelacja) i związku przyczynowego.