W jakim stopniu rozróżnienie między korelacją a związkiem przyczynowym ma znaczenie dla Google?

21

Kontekst

Popularnym pytaniem na tej stronie jest „ Jakie są typowe grzechy statystyczne? ”. Jednym z grzechów wspomniano przy założeniu, że „korelacja implikuje przyczynowości ...” Link

Następnie w komentarzach z 5 pozytywnymi opiniami sugeruje się, że: „Google zarabia 65 mld USD rocznie, nie dbając o różnicę”.

Ryzykując nadmierną analizę lekkiego żartu, pomyślałem, że może to być przydatny punkt do dyskusji na temat rozróżnienia między korelacją a przyczynowością oraz praktycznego znaczenia tego rozróżnienia; i być może mogłoby to uwypuklić coś na temat związku między uczeniem maszynowym a rozróżnieniem między korelacją a przyczyną.

Zakładam, że komentarz dotyczy technologii, które leżą u podstaw generowania wyników wyszukiwania i technologii związanych z wyświetlaniem reklam.

Pytanie

W jakim stopniu rozróżnienie między korelacją a związkiem przyczynowym jest istotne dla generowania dochodów Google, być może koncentrując się w szczególności na generowaniu dochodów dzięki technologiom związanym z wyświetlaniem reklam i wysokiej jakości wynikom wyszukiwania?

machine-learning causality

— Jeromy Anglim
źródło

To zabawne, patrzyłem na ten komentarz nieco wcześniej.

— Iterator,

2

Blog Revolutions zamieścił w zeszłym tygodniu post na temat tego, jak Google używa R, aby zwiększyć skuteczność reklam online . Niestety nie podają zbyt wielu szczegółów ...

— nico

13

Prosta odpowiedź brzmi: Google (lub ktokolwiek) powinien dbać o to rozróżnienie w zakresie, w jakim zamierza interweniować . Wiedza przyczynowa mówi ci o skutkach interwencji (działań) w danej dziedzinie.

Jeśli na przykład Google chce zwiększyć współczynniki klikalności reklam, zwiększyć liczbę użytkowników Gmaila lub Google+, albo nakłonić użytkowników do korzystania z Google zamiast Bing, muszą znać skutki potencjalnych działań (np. Zwiększenie rozmiar czcionki reklam, promowanie Google+ w czasopismach drukowanych lub publikowanie różnic między odpowiednio wynikami wyszukiwania Google i Bing). Korelacja jest wystarczająco dobra, aby wyszukiwarka Google działała dobrze, ale w przypadku innych systemów (i całej firmy) rozróżnienie często ma znaczenie.

Warto zauważyć, że Google (i wiele firm z firmami internetowymi) stale przeprowadza eksperymenty online. Jest to jeden z najprostszych i najlepszych sposobów identyfikowania i szacowania zależności przyczynowych.

— David Jensen
źródło

(+1) tak długo, jak długo predyktory a) korelują ib) pozwalają poprawnie przewidzieć przyszłe wyniki, nie należy się martwić o związek przyczynowy.

— steffen,

2

Wkraczamy w erę ożywienia badań eksperymentalnych w naukach behawioralnych. W latach 50. prawie wszystkie statystyki były badaniami eksperymentalnymi, mającymi zastosowanie w rolnictwie. Ale około lat osiemdziesiątych ludzie zdali sobie sprawę, że te techniki nie pomagają w danych obserwacyjnych, co jest wszystkim, co można zrobić w większości nauk społecznych. Teraz, przynajmniej w niszach badań marketingu internetowego, jeśli jesteś Amazon, Google lub Bing, możesz przeprowadzać eksperymenty i uzyskać najczystszą możliwą formę wnioskowania przyczynowego.

— StasK,

@StasK, biorąc pod uwagę rozmiary próbek, z którymi prawdopodobnie mają do czynienia nawet w „krótkim” eksperymencie, mogą one przynieść bardzo przydatne wyniki. Co to musi być skarbiec.

— Brandon Bertelsen,

Warto zauważyć, że funkcja „grup” Google jest naprawdę bardzo słaba. To tak, jakby zbudowali narzędzie do dyskusji grupowej, które koreluje z byciem dobrym, ale nie zorientowali się, co powoduje, że narzędzie do dyskusji grupowej jest dobre. Jest to jednak powszechny problem w marketingu - zbyt często funkcje konkurencyjnych produktów są kopiowane bez zrozumienia ich motywacji.

— Daniel R Hicks,

1

@StasK: Prawdziwy świat prawdopodobnie nie jest tak idealny, jak tu udajesz. Zgadzam się, że eksperymenty są doskonałym narzędziem do wnioskowania przyczynowego. Eksperymenty rodzą jednak również określone problemy. Czasami lepiej byłoby wyciągać wnioski przyczynowe za pomocą badania obserwacyjnego niż eksperymentu. Jedna krytyka może dotyczyć tego, w jaki sposób wyniki kontrolowanych eksperymentów mogą zostać uogólnione na „prawdziwe życie”. Niektórzy autorzy nazywają to „zewnętrzną ważnością”.

6

Po pierwsze, to tylko żart i jest niepoprawny. Google ma wielu bardzo utalentowanych statystyk, ekspertów od wyszukiwania informacji, językoznawców, ekonomistów, niektórych psychologów i innych. Ci ludzie spędzają dużo czasu, ucząc wielu niestatystów na temat różnicy między korelacją a przyczyną. Biorąc pod uwagę, że jest to duża organizacja, mogą istnieć kieszenie, nawet duże kieszenie, niewiedzy, ale twierdzenie jest zdecydowanie fałszywe. Co więcej, duża część tej edukacji ma do czynienia z klientami, zwłaszcza z reklamodawcami.

Głębsza odpowiedź: różnica jest niezwykle ważna. Wystarczy spojrzeć na ranking wyników wyszukiwania i pozwolić mi wyjść poza samą „korelację”, aby uwzględnić miary podobieństwa, funkcje oceniania itp. Niektóre strony są oceniane jako dobre wyniki dla niektórych zapytań. Mają różne funkcje predykcyjne, które są ważne dla ich rankingu. W przeciwieństwie do tych dobrych stron, które są dobrymi wynikami dla zapytań, jest to zestaw stron internetowych, które są bardzo złymi wynikami dla tych samych zapytań. Jednak twórcy tych stron poświęcają wiele wysiłku, aby wyglądali jak dobre strony z liczbowego punktu widzenia, takie jak dopasowania tekstowe, łącza internetowe i inne. Jednak fakt, że strony te są liczbowo „podobne” do dobrych stron, nie oznacza, że w rzeczywistości są to dobre strony. Dlatego Google zainwestował i będzie nadal inwestował wiele wysiłku, aby określić, jakie rozsądne funkcje odróżniają (oddzielne) dobre i złe strony.

To nie jest całkiem korelacja i związek przyczynowy, ale jest głębsze. Dobre strony dla niektórych zapytań mogą być odwzorowane w przestrzeni numerycznej, gdzie wyglądają podobnie i różnią się od wielu nietrafnych lub złych stron, ale to, że wyniki znajdują się w tym samym obszarze przestrzeni cech, nie oznacza, że pochodzą z tego samego podzbioru „wysokiej jakości” w sieci.

Prostsza odpowiedź: bardzo prostą perspektywą jest odniesienie się do rankingu wyników. Najlepszy wynik powinien być pierwszy, ale fakt, że coś jest na pierwszym miejscu, nie oznacza, że jest to najlepszy wynik. Według niektórych wskaźników oceny może się okazać, że ranking Google jest skorelowany ze złotym standardem ocen jakości, ale to nie znaczy, że ich ranking sugeruje, że wyniki są naprawdę w tej kolejności pod względem jakości i trafności.

Aktualizacja (trzecia odpowiedź): z czasem pojawia się inny aspekt, który wpływa na nas wszystkich: najwyższy wynik Google może zostać uznany za wiarygodny, ponieważ jest to najlepszy wynik w Google. Chociaż analiza linków (np. „PageRank” - jedna metoda analizy linków) jest próbą odzwierciedlenia postrzeganej autorytatywności, z czasem nowe strony w temacie mogą po prostu wzmocnić tę strukturę linków poprzez link do najlepszego wyniku w Google. Nowsza strona, która jest bardziej autorytatywna, ma problem z przewrotką w stosunku do pierwszego wyniku. Jak Google chce dostarczyć najbardziej odpowiedniej strony w chwili obecnej , wiele czynników, w tym tak zwanym „bogaty-get-bogatsze” zjawisko, wynikać domniemany efekt korelacji na postrzeganą przyczynowości.

Aktualizacja (czwarta odpowiedź): zdałem sobie sprawę (dla komentarza poniżej), że warto przeczytać Alegorię jaskini Platona, aby dowiedzieć się, jak interpretować korelację i związek przyczynowy w wyniku „refleksji / projekcji” rzeczywistości i jak my (lub nasze maszyny) to postrzegamy. Korelacja, ściśle ograniczona do korelacji Pearsona, jest zdecydowanie zbyt ograniczona jako interpretacja problemu nieporozumienia (szerszej niż tylko korelacja) i związku przyczynowego.

— Iterator
źródło

Nie zgadzam się. Jeśli ktoś nadużywa predyktorów, aby stworzyć sztucznie wysoki ranking strony, wówczas cel implikuje predyktory, w przeciwieństwie do tego, co zamierzał Google podczas tworzenia algorytmu rankingu strony. Ponieważ prawdziwa metryka pozostaje taka sama („prawa strona”, do której pozycja strony stanowi jedynie przybliżenie), predyktory tracą swoją korelację i dlatego muszą zostać zmienione. Dlatego Google nie dba o związek przyczynowy w odniesieniu do prawdziwej metryki „właściwej strony”, ale do przybliżonej o nazwie page-rank.

— steffen,

Bez obrazy, ale wydajesz się trochę zdezorientowany kilkoma kwestiami. „PageRank” jest jasno zdefiniowanym pojęciem i jest tylko jednym predyktorem. Główny problem, który pomijasz, to proces przemysłowy związany z definiowaniem i tworzeniem zestawu szkoleniowego, a także dopasowywaniem oczekiwań użytkowników. Niestety, komentarze są okropnym miejscem do rozpoczęcia długiego wprowadzenia do stosowanego uczenia maszynowego.

— Iterator,

Czy masz na myśli to, że w procesie generowania i oceny predyktorów na podstawie wiedzy eksperckiej generowane są tylko czynniki „przyczynowe”? Tak długo, jak postępujemy zgodnie z takim procesem i nie wracamy do metody prób i błędów, masz rację, Google dba;).

— steffen,

Masz całkowitą rację. Problem polega na tym, że z czasem niezwykle trudna staje się próba wyszukania predyktorów odzwierciedlających związek przyczynowy, gdy przeszkadzają ci przeciwnicy. Jeśli predyktor nie ma jakiegoś wyjaśnienia przyczynowego (ponieważ rzadko mają one naprawdę charakter przyczynowy), trudno jest uzasadnić, kiedy złoczyńcy ewoluują i niszczą ten obszar przestrzeni predyktora.

— Iterator,

2

@Brandon: Bez żartów. Najlepszym przykładem jest to, gdy próbuję wyszukać ostatnie lub nadchodzące wydarzenia. Coraz częściej muszę wpisywać bieżący rok lub nawet bieżący MM-RRRR (lub wyszukiwać zaawansowane), aby uzyskać odpowiednie strony. Jest to kompromis między strukturą linków a świeżością, a Google robi to źle bez dalszej pomocy ode mnie. W rzeczywistości doprowadziło mnie to do Bing kilka razy, po prostu z irytacji próbą zignorowania starych stron. To samo dotyczy SO: pierwsze odpowiedzi często wydają się mieć więcej głosów pozytywnych niż późniejsze odpowiedzi, które mogą być bardziej poprawne. :)

— Iterator,

5

Autor quipu tutaj.

Ten komentarz został częściowo zainspirowany przemową Davida Mease'a (w Google), w której powiedział, a parafrazuję, że firmy ubezpieczeniowe samochodów nie dbają o to, czy bycie mężczyzną powoduje więcej wypadków, o ile jest to skorelowane, muszą naliczać więcej. W rzeczywistości nie można zmienić czyjejś płci w eksperymencie, więc przyczyny nie można było nigdy wykazać.

W ten sam sposób Google nie musi się przejmować, czy kolor czerwony zmusza kogoś do kliknięcia reklamy, jeśli jest skorelowany z większą liczbą kliknięć, może za nią zapłacić więcej.

Inspiracją był także ten artykuł w Wired: The End of Theory: The Data Deluge Sprawia, że metoda naukowa staje się przestarzała . Cytat:

„Podstawową filozofią Google jest to, że nie wiemy, dlaczego ta strona jest lepsza niż ta: jeśli statystyki przychodzących linków mówią, że tak, to wystarczy”.

Oczywiście Google ma wielu bardzo inteligentnych ludzi, którzy znają różnicę między przyczynowością a korelacją, ale w ich przypadku mogą zarobić mnóstwo pieniędzy, nie dbając o to.

— Neil McGuigan
źródło

1

Aby rozwinąć ... Jak wspomniałem, w Google jest wielu ludzi, którzy tak naprawdę się tym przejmują, podobnie jak David Mease. (Btw, nie ma go w Stanford, chyba że są jakieś wiadomości, które przegapiłem; może uczestniczyłeś w jego kursie w 2007 roku?) Ale masz rację, ponieważ wiele osób nie wie, jak działają silniki spalinowe, to nie wpływa na ich zdolność prowadzenia pojazdów. Jednak dobrzy inżynierowie i badacze motoryzacyjni sprawiają, że działa lepiej, ponieważ tak robią. To samo dotyczy inżynierów i badaczy w Google. Niestety ten artykuł przewodowy nie jest najbardziej wyrazistym przedstawieniem pracy Norviga.

— Iterator

Dzięki Neil za kontekst. Mam nadzieję, że nie masz nic przeciwko temu, że użyję twojego komentarza jako inspiracji do pytania.

— Jeromy Anglim

@jeromy, wcale nie

— Neil McGuigan

1

Zgadzam się z Davidem : różnica ma znaczenie, jeśli zamierzasz interweniować, a Google może przetestować wyniki interwencji, przeprowadzając kontrolowane eksperymenty. (Optymalny harmonogram takich eksperymentów zależy od zestawu hipotez przyczynowych, których uczysz się z poprzednich eksperymentów oraz danych obserwacyjnych , więc korelacje są nadal przydatne!)

Istnieje drugi powód, dla którego Google może chcieć poznać związki przyczynowe. Relacje przyczynowe są bardziej odporne na interwencje innych graczy. Interwencje mają zwykle charakter lokalny, więc mogą zmienić jedną część sieci przyczynowej, ale pozostawić wszystkie pozostałe mechanizmy przyczynowe bez zmian. Natomiast relacje predykcyjne mogą zawieść, jeśli zerwane zostanie odległe połączenie przyczynowe. Internet stale się zmienia, a Google powinien być zainteresowany tym, które funkcje środowiska online są bardziej odporne na te zmiany.

— Lizzie Silver
źródło