Snažil jsem se přijít na nejlepší způsob, jak to vysvětlit, a narazil jsem na stránku, která to dělá opravdu pěkně. Raději bych tomuto člověku připsal zásluhy za vysvětlení. Pro případ, že by někomu odkaz nefungoval, uvádím níže několik informací.
Zjednodušeně řečeno: hodnota #R^2# je prostě kvadrát korelačního koeficientu #R#.
Korelační koeficient ( #R# ) modelu (řekněme s proměnnými #x# a #y#) nabývá hodnot mezi #-1# a #1#. Popisuje, jak jsou #x# a #y# korelovány.
- Jsou-li #x# a #y# v dokonalé shodě, pak bude tato hodnota kladná #1#
- Pokud #x# roste, zatímco #y# klesá přesně opačným způsobem, pak tato hodnota bude #-1#
- #0# by byla situace, kdy mezi #x# a #y# neexistuje žádná korelace
Tato hodnota #R# je však užitečná pouze pro jednoduchý lineární model (pouze #x# a #y#). Jakmile uvažujeme více než jednu nezávislou proměnnou (nyní máme #x_1#, #x_2#, …), je velmi obtížné pochopit, co korelační koeficient znamená. Sledovat, která proměnná se na korelaci podílí jakým způsobem, není tak jednoznačné.
Tady vstupuje do hry hodnota #R^2#. Je to jednoduše čtverec korelačního koeficientu. Nabývá hodnot mezi #0# a #1#, přičemž hodnoty blízké #1# znamenají větší korelaci (ať už pozitivní nebo negativní) a #0# neznamená žádnou korelaci. Jiný způsob, jak si jej představit, je částečná změna závislé proměnné, která je výsledkem všech nezávislých proměnných. Pokud je závislá proměnná vysoce závislá na všech nezávislých proměnných, bude se hodnota blížit hodnotě #1#. Takže #R^2# je mnohem užitečnější, protože se dá použít i k popisu vícerozměrných modelů.
Pokud byste chtěli diskutovat o některých matematických pojmech spojených se vztahem těchto dvou hodnot, podívejte se na tento .
.