Korelace není nutně kauzalita

Korelace není kauzalita

Další názvy

  • Correlation does not equal causation

Kategorizace

Mluvčí uzavírá, že jeden jev způsobuje druhý pouze na základě korelace dvou hodnot.

Jedná se o konkrétní případ Důkazu statistikou.

 Korelace je situace, kdy dva jevy souvisí jeden s druhým způsobem, který vypadá, že není náhodný.  Korelace nabývá kladných hodnot až do hodnoty 1, pokud se změny dvou hodnot pohybují stejným směrem (čím větší A, tím větší B), záporných hodnot až do hodnoty -1 za situace, kdy se změny dvou hodnot pohybují opačným směrem (čím větší A, tím menší B).

Kauzalita znamená, že jev A způsobuje či významně ovlivňuje jev B.

Ve článcích na internetu a v novinách se velmi často tohoto faulu autoři dopouštějí nepřímo, kdy píšou o „souvislosti“ či něčem podobném, co v nás vyvolává dojem kauzální (příčinné) souvislosti na základě našeho podvědomého předpokladu, že kdyby mezi jevy nebyla doložená nebo předpokládaná kauzální souvislost, tak se o nich vůbec nepíše jako o něčem, co spolu souvisí.

Jinými slovy – podvědomě předpokládáme, že pokud novinář píše o korelaci, pak k tomu asi má pádný důvod v podobě nějakého příčinného vztahu.

Často se píše o „spojitosti“ (angl. link) mezi jevem a jevem B. Potíž je v tom, že často se málo zdůrazňuje, že tato spojitost může znamenat velmi málo nebo vůbec nic. Kvůli Primingu máme podvědomě dojem, že jev, který v titulku čteme jako první, způsobil ten druhý, i když technicky vzato nikdo nic takového ani nenaznačuje. Dva minipříklady:

„Vědci nalezli spojitost mezi kašláním a rakovinou plic“ v nás vyvolává dojem, že bychom možná měli něco udělat pro to, abychom méně kašlali, protože by to mohlo způsobovat rakovinu plic

„Vědci nalezli spojitost mezi rakovinou plic a kašláním“ nás jako titulek poněkud vyvede z míry, protože takováto spojitost nám přijde nabíledni.

Ve skutečnosti ale oba dva titulky říkají naprosto totéž.

Příklady jevů, které spolu pozitivně korelují:

Příklady jevů, které spolu korelují negativně:

  • Počet žen a mužů v náhodných vzorcích populace
  • Příjem a pravděpodobnost psychické nemoci

Je však na nás vysvětlit, čím je určitá korelace způsobena. Možná vysvětlení:

  • A způsobuje nebo ovlivňuje B
  • B způsobuje nebo ovlivňuje A
  • Existuje společná příčina C, která způsobuje nebo ovlivňuje B i A
  • Náhodná shoda
  • Komplikovanější souhra výše uvedených možností

Příkladem komplikovanějších souher v tomto případě může být například tzv. zpětná smyčka. Nastává v situaci, kdy se výstup nějakého systému zpětně stává vstupem téhož systému. Pozitivní zpětnou smyčkou nazýváme takový cyklus, který zvyšuje efekt systému; negativní zpětnou smyčkou pak nazýváme takový cyklus, který efekt snižuje.

Takovou pozitivní zpětnou smyčkou může být tenis. Čím lépe hraje váš oponent, tím lépe hrajete vy, čím lépe hrajete vy, tím lépe hraje on, dokud se nedostanete na úroveň vaší kolektivní nejlepší hry. S protihráčem budete proto vždy hrát lépe než proti zdi – a na podobném principu funguje i diskuze, protože čím lépe argumentuje váš oponent, tím lépe argumentujete vy. Proto se dobereme v diskuzi pravdy mnohem snáze, než kdybychom rozjímali každý o samotě. Idealizovaný graf takového vztahu vypadá jako exponenciální křivka.

Příkladem negativní zpětné smyčky mohou být populace predátora a jeho kořisti v daném ekosystému. Aby se predátor mohl úspěšně množit, spotřebovává kořist, čímž snižuje její populaci. V určitém momentě tedy populace predátora stoupá, protože má dostatek potravy v podobě svojí kořisti – v určitém momentě později však přijde bod, kdy je kořisti tak málo, že populace predátora začne opět klesat. V reakci na to však začne stoupat populace kořisti a v tu chvíli má predátor dost potravy na to, aby jeho populace začala zase stoupat – a cyklus se opakuje. Idealizovaně pak vypadá takovýto vztah jako dvě sinusové vlny.

Toto je jen malý příklad toho, jak mohou být interakce mezi jevy A a B komplikované, a slouží jako ilustrace závažnosti tohoto faulu. Mluvčí u tohoto faulu totiž zpravidla předpokládají přímou, jednoduchou kauzalitu. Občas jsou tyto jevy však úplně jednoduché – v jakémkoli vzorku lidí je každý člověk buď žena, nebo muž s tím, že nikdy není obojí zaráz a nikdy nemůže být ani jedno. Korelace tedy znamená pouhý fakt, že „čím více žen, tím méně mužů“, což vyplývá z logiky věci a je příkladem statisticky významného jevu, který je však prakticky zcela bezvýznamný.

Jsou ve skutečnosti způsoby, jak v rámci studie prokázat kromě samotné korelace i kauzalitu (přestože ne jednoznačně), což bývají zpravidla komplikované a nákladné dvojitě zaslepené studie nebo neméně komplikované a nákladné longitudinální studie, které zde nebudeme dopodrobna rozebírat.

Příklady

„Zmrzlina způsobuje vražedné šílenství. Když stoupá prodej zmrzliny, stoupá i počet vražd; když klesá prodej zmrzliny, klesá i počet vražd.“

Prototypický příklad tohoto faulu. Jeho nesmyslnost je zřejmá na první pohled – tato korelace pravděpodobně vyplývá z dosud neznámého vztahu zvýšeného počtu vražd v létě a zcela evidentního vztahu prodeje zmrzliny a vysokých letních teplot.

„Násilné počítačové hry způsobují agresivitu u hráčů, protože vidíme z těchto dat, že hráči vykazující agresivní chování častěji hrají násilné hry.“

V nedávné minulosti velmi často omílaný faul. Mluvčí nekriticky uvádí souvislost mezi dvěma jevy jako kauzalitu, u čehož využívá potenciálního strachu obecenstva. Nezvažuje přitom například možnost, že agresivnější hráči mají oproti neagresivním hráčům tendenci si vybírat násilnější hry.

„Filmy od Nicolase Cage jsou často tak špatné, že se kvůli nim často lidé chodí utopit do bazénu.“

Jedna se ve skutečnosti o čisté náhodnou korelaci převzatou z webové stránky www.spuriouscorrelations.com. Jejich autor napsal program, který prochází obrovská množství dat na internetu a hledá v nich souvislosti. Autor z nich pak vybírá ty očividně nejnáhodnější a zveřejňuje je na svých stránkách, aby tak upozornil na tento faul.

„Větší příjem znamená větší marnotratnost člověka, protože víme, že když někdo zbohatne, začne více utrácet.“

Takovéto tvrzení je na hranici toho, co by se dalo označit za faul. Mluvčí má v principu pravdu – problematický je nezanedbatelný emotivní podkres („marnotratnost“ nese výraznou negativní konotaci) a také fakt, že mluvčí výběrem tohoto slovo zanedbává případnou pozitivní zpětnou smyčku reinvestic, kdy člověk využívá vydělané peníze k tomu, aby vydělal další. Toto tvrzení však nelze označit jednoznačně za faul.

„Chudoba je extrémně stresující a způsobuje psychické nemoci.“

Toto tvrzení je faulem jednoznačněji, protože sice zcela správně uvádí, že chudoba (A) způsobuje psychické nemoci (B), zanedbává ale, že s psychickou nemocí je velmi obtížné efektivně pracovat, což má velmi negativní vliv na příjem dané osoby (B také způsobuje A). Zanedbává tedy (tentokrát už výrazněji) pozitivní zpětnou smyčku.

„Pozitivní“ v tomto kontextu znamená, že se oba jevy navzájem zesilují. Projekt Bez faulu není toho názoru, že chudoba nebo psychické nemoci jsou pozitivní jevy.

„V Africe roste populace čím dál tím více. To způsobuje vyšší životní úroveň, čímž spotřebovávají mnohem více zdrojů, což nakonec povede ke světovému přemnožení a ničivým válkám a hladomorům.“

Mluvčí zamlčuje pravděpodobnou možnost, že je to naopak právě životní úroveň, která způsobuje vyšší populační přírůstek.

Krom toho předpokládá, že tento populační nárůst nemá žádný přirozený limit, a předpokládá nárůst do momentu kataklyzmatických událostí. Tento následující faul nazýváme Unáhlenou extrapolací.

Hledáte něco jiného?