Вход в систему

Корреляция

 

КОРРЕЛЯЦИЯ – связь между двумя или более переменными (в последнем случае корреляция называется множественной). Цель корреляционного анализа – установление наличия или отсутствия этой связи, то есть установление факта зависимости каких-либо явлений, процессов друг от друга или их независимости [1-4].

В случае, когда имеются две переменные, значения которых измерены в шкале отношений[1], используется коэффициент линейной корреляции Пирсона r, который принимает значения от -1 до +1 (нулевое его значение свидетельствует об отсутствии корреляции[2]) – см. Рис. 1, на котором каждая точка соответствует отдельному объекту, описываемому двумя переменным – x и y. Термин «линейный» свидетельствует о том, что исследуется наличие линейной связи между переменными – если r(x, y) = 1, то одна переменная линейно зависит от другой (и, естественно, наоборот), то есть существуют константы a и b, причем > 0, такие что = a x + b.

На рисунках 1а и 1в изображены ситуации, когда все экспериментальные точки лежат на прямой (абсолютное значение коэффициента линейной корреляции равно единице). В ситуации, изображенной на рисунке 1б, однозначно провести прямую через экспериментальные точки невозможно (коэффициент линейной корреляции равен нулю).

 

 

 

Рисунок 1 – Величины коэффициента линейной корреляции в различных ситуациях

 

Если экспериментальные точки сгруппированы около некоторой прямой – см. рисунки 1г и 1д, то коэффициент линейной корреляции принимает значения, отличные от нуля, причем чем «ближе» точки к прямой, тем выше абсолютное значение коэффициента линейной корреляции. То есть, чем выше абсолютное значение коэффициента Пирсона, тем сильнее исследуемые переменные линейно связаны между собой.

Для данных, измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена (он может применяться и для данных, измеренных в интервальной шкале, так как является непараметрическим и улавливает тенденцию – изменения переменных в одном направлении), который обозначается s и определяется сравнением рангов – номеров значений сравниваемых переменных в их упорядочении.

Коэффициент корреляции Спирмена является менее чувствительным, чем коэффициент корреляции Пирсона (так как первый в случае измерений в шкале отношений учитывает лишь упорядочение элементов выборки). В то же время, он позволяет выявлять корреляцию между монотонно нелинейно связанными переменными (для которых коэффициент Пирсона может показывать незначительную корреляцию – см. рисунок 2.

 

Рисунок 2 – Пример: коэффициент линейной корреляции (Пирсона) равен нулю для функционально (нелинейно и немонотонно) связанных переменных

Литература

Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях. – М.: ЮНИТИ, 2001.Литература

  1. Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте (типовые случаи). – Волгоград: Издательство ВолГМУ, 2005.
  2. Орлов А.И. Эконометрика. – М.: Экзамен, 2004 (3-е изд.).
  3. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. – М.: ИНФРА-М, 1998.




[1] Единицы измерений при этом не важны – например, масса тела может быть измерена в граммах, килограммах, тоннах – они не влияют на значение коэффициента корреляции.

[2] Корректно говоря, этот факт справедлив в случае, если анализируемая пара переменных описывается двумерным нормальным распределением.