Как найти эмпирический коэффициент корреляции

Эмпирическое корреляционное отношение

Краткая теория


Для измерения тесноты и силы связи между факторным и
результативным признаками рассчитывают специальные показатели – эмпирический
коэффициент детерминации

  и эмпирическое корреляционное отношение

.

Эмпирический коэффициент детерминации

  оценивает силу связи, определяя, насколько
вариация результативного признака Y объясняется вариацией фактора Х (остальная
часть вариации Y объясняется вариацией прочих факторов). Показатель

  рассчитывается как доля межгрупповой
дисперсии в общей дисперсии по формуле

где 

  – общая дисперсия признака Y,

       

 – межгрупповая (факторная) дисперсия признака
Y.

Значения показателя

 изменяются в пределах

 . При отсутствии корреляционной связи между
признаками Х и Y имеет место равенство  

,
а при наличии функциональной связи между ними – равенство 

.

Общая дисперсия

  характеризует вариацию результативного
признака, сложившуюся под влиянием всех действующих на Y факторов
(систематических и случайных). Этот показатель вычисляется по формуле

где 

 – индивидуальные значения результативного
признака;

        


общая средняя значений результативного признака;

        

 – число единиц совокупности.

Общая средняя

  вычисляется как средняя арифметическая
простая по всем единицам совокупности:

или как средняя взвешенная по частоте
групп интервального ряда:

Пример решения задачи


Задача

По
данным о распределении рабочих строительной фирмы по квалификации вычислить
общую дисперсию, используя правило сложения дисперсий и эмпирическое
корреляционное отношение.

Тарифные разряды Число рабочих по
подразделениям
СУ№1 СУ№2 СУ№3
1 5 10 10
2 10 20 20
3 15 30 60
4 25 25 120
5 40 20 80
6 5 10 40

Решение

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Расчет межгрупповой и средней внутригрупповой дисперсии

Расчетная вспомогательная таблица

Тарифные разряды Число рабочих по
подразделениям
Итого
СУ№1 СУ№2 СУ№3
1 5 10 10 25
2 10 20 20 50
3 15 30 60 105
4 25 25 120 170
5 40 20 80 140
6 5 10 40 55
Итого 100 115 330 545

Вычислим
среднюю для всей совокупности:

Средняя
по СУ-1:

Вычислим
межгрупповую дисперсию:

Вычислим
внутригрупповые дисперсии:

Средняя
из внутригрупповых дисперсий:

Эмпирическое
корреляционное отношение и эмпирический коэффициент детерминации

Согласно
правилу сложения дисперсий, общая дисперсия будет равна:

Эмпирическое
корреляционное отношение:

Вывод к задаче

Таким
образом, общая дисперсия

. Эмпирическое корреляционное отношение равно 0,192- связь – в
величине средних по выделенным группам колеблемость слабая.

Эмпирическое
корреляционное отношение вычисляется
для всех форм связи и служит для измерение
тесноты зависимости. Изменяется в
пределах [0;1].

где

Индекс
корреляции
.

Для
линейной регрессии индекс корреляции
равен коэфииценту корреляции rxy
= -0.82.

Полученная
величина свидетельствует о том, что
фактор x существенно влияет на y

Для
любой формы зависимости теснота связи
определяется с помощью множественного
коэффициента корреляции
:

Данный
коэффициент является универсальным,
так как отражает тесноту связи и точность
модели, а также может использоваться
при любой форме связи переменных. При
построении однофакторной корреляционной
модели коэффициент множественной
корреляции равен коэффициенту парной
корреляции rxy.

В
отличие от линейного коэффициента
корреляции он характеризует тесноту
нелинейной связи и не характеризует ее
направление. Изменяется в пределах
[0;1].

Теоретическое
корреляционное отношение

для линейной связи равно коэффициенту
корреляции rxy.

1.6.
Коэффициент детерминации
.

Квадрат
(множественного) коэффициента корреляции
называется коэффициентом детерминации,
который показывает долю вариации
результативного признака, объясненную
вариацией факторного признака.

Чаще
всего, давая интерпретацию коэффициента
детерминации, его выражают в процентах.

R2=
-0.822
= 0.6742

т.е.
в 67.42 % случаев изменения х приводят к
изменению y. Другими словами – точность
подбора уравнения регрессии – средняя.
Остальные 32.58 % изменения Y объясняются
факторами, не учтенными в модели.

Для
оценки качества параметров регрессии
построим расчетную таблицу (табл. 2)

x

y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y
– yx|:y

10.3

1.25

1.28

0.0135

0.00111

4.52

0.0267

10.5

1.13

1.27

1.6E-5

0.0194

3.71

0.12

10.6

1.29

1.26

0.0243

0.000767

3.34

0.0215

10.7

1.22

1.26

0.0074

0.00124

2.98

0.0289

11

1.28

1.23

0.0213

0.0021

2.04

0.0358

11.5

1.12

1.2

0.000196

0.00626

0.86

0.0706

12

1.2

1.16

0.00436

0.0013

0.18

0.03

12.2

1.18

1.15

0.00212

0.000905

0.0514

0.0255

12.5

1.24

1.13

0.0112

0.0124

0.00538

0.0896

12.6

1.15

1.12

0.000256

0.000794

0.03

0.0245

13

1.13

1.09

1.6E-5

0.00132

0.33

0.0321

13.9

1.17

1.03

0.0013

0.0195

2.17

0.12

14.4

0.95

1

0.0339

0.00206

3.89

0.0478

15.2

1

0.94

0.018

0.0037

7.69

0.0608

16

0.7

0.88

0.19

0.0335

12.77

0.26

186.4

17.01

17.01

0.33

0.11

44.57

1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Коэффициент корреляции и коэффициент детерминации

Эмпирический коэффициент детерминации

Эмпирический коэффициент детерминации широко используется в задачах статистики и является показателем, который представляет долю межгруппопой дисперсии в общей дисперсии результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:

Коэффициент детерминации

Данный коэффициент показывает долю вариации результативного признака у под влиянием фактора х. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной сильной связи — единице.

Эмпирическое корреляционное отношение

Эмпирическое корреляционное отношение представляется как корень квадратный из эмпирического коэффициента детерминации. Оно показывает тесноту связи между статистическими данными и определяется по формуле:

Эмпирическое корреляционное отношение

где числитель — дисперсия групповых средних;
знаменатель — общая дисперсия.

Корреляционное отношение равно нулю, если связи между данными нет. В таком случае все групповые средние будут равны между собой и межгрупповой вариации не будет.

Корреляционное отношение равно единице тогда, когда связь функциональная. В этом случае дисперсия групповых средних будет равна общей дисперсии, т. е. внутригрупповой вариации не будет.

Чем значения корреляционного отношения ближе к единице, тем сильнее, ближе к функциональной зависимости связь между признаками.

Критерий Пирсона

Критерий Пирсона вычисляется по формуле:

Критерий Пирсона

где fэ и fт — эмпирические и теоретические частоты.

С помощью критерия Пирсона по таблицам определяют вероятность P(х^2). Входами в таблицу являются значения х^2 и число степеней свободы k = n — р -1.

Если Р > 0,05, то считается, что эмпирические и теоретические распределения близки. При Р принадлежащим [0,02; 0,05] совпадение между ними удовлетворительное, а в других случаях — недостаточное.

Коэффициент асимметрии

Коэффициент асимметрии рассчитывается по формуле:

Коэффициент асимметрии

где числитель — центральный момент третьего порядка.

момент третьего порядка

б^3 — куб среднего квадратичного отклонения.

Коэффициент асимметрии является безмерной величиной, что позволяет использовать его для различных распределений. При левосторонней асимметрии Mо > Mt > xср, при правосторонней — обратные соотношения. Это позволяет применять наиболее простой показатель асимметрии:

Коэффициент асимметрии при левосторонней и правосторонней асимметрии

Эксцесс в статистике

Эксцесс есть степень крутости эмпирического распределения по отношению к нормальному. Он определяется по формуле:

Эксцесс

где числитель — центральный момент четвертого порядка

момент четвертого порядка

Когда распределение островершинное по отношению к нормальному, эксцесс будет положительным, если плосковершинное — отрицательным. Для нормального распределения Е = 0.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

Теория

Корреляционное отношение

В случае наличия линейной или нелинейной зависимости между двумя признаками для измерения тесноты связи применяют корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение. Эмпирическое корреляционное отношение рассчитывается по данным группировки.

При отклонении парной статистической зависимости от линейной коэффициент корреляции теряет свой смысл как характеристика тесноты связи. В этом случае можно воспользоваться таким измерителем связи, как индекс корреляции (корреляционное отношение). Корреляционное отношение применяется в случае нелинейной зависимости между признаками и определяется через отношение межгрупповой дисперсии к общей дисперсии.

Для определения эмпирического корреляционного отношения совокупность значений результативного признака У разбивают на отдельные группы. В основу группировки кладется исследуемый фактор Х. Когда изучаемая совокупность (в виде корреляционной таблицы) разбивается на группы по одному (факторному) признаку Х, то для каждой из этих групп можно вычислить соответствующие групповые средние результативного признака. Изменение групповых средних от группы к группе свидетельствует о наличии связи результативного признака с факторным признаком, а примерное равенство групповых средних – об отсутствии связи. Следовательно, чем большую роль в общем изменении результативного признака играет изменение групповых средних (за счет влияния факторного признака), тем сильнее влияние этого признака.

Методика вычисления корреляционного отношения состоит в следующем.

Пусть группирование данных произведено, при этом k – число интервалов группирования по оси Х; – количество элементов выборки в j-ом интервале группирования; n – объем совокупности (); – общее среднее.

  1. Вычисляют среднее значение Y в j-ой группе (интервале группирования):

(6),

где l-ый элемент j-ой группы.

  1. Вычисляют общую среднюю Y, используя средние значения в каждой группе:

(7)

  1. Определяют межгрупповую дисперсию (дисперсия групповых средних или факторная дисперсия – дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у) и общую дисперсию:

(8, 9)

  1. Рассчитывают корреляционное отношение η зависимой переменной Y по независимой переменной Х может быть получено из отношения межгрупповой дисперсии к общей дисперсии:

(10)

По правилу сложения дисперсий:

(11)

где остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов, кроме х.

Эмпирическое корреляционное отношение рассчитывается по формуле:

где – средняя из частных (групповых дисперсий);

– общая дисперсия;

– межгрупповая дисперсия (дисперсия групповых средних).

Теоретическое корреляционное отношение определяется по формуле:

где – дисперсия выровненных значений результативного признака, т.е. рассчитанных по уравнению регрессии;

– дисперсия эмпирических (фактических) значений результативного признака;

– остаточная дисперсия.

Величина корреляционного отношения изменяется от 0 до 1. Близость ее к нулю говорит об отсутствии связи, близость к единице – о тесноте связи.

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока):

Значение

Характер связи

Значение

Характер связи

η = 0

Отсутствует

0,5 ≤ η < 0,7

Заметная

0 < η < 0,2

Очень слабая

0,7 ≤ η < 0,9

Сильная

0,2 ≤ η < 0,3

Слабая

0,9 ≤ η < 1

Весьма сильная

0,3 ≤ η < 0,5

Умеренная

η = 1

Функциональная

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = |r|.

В статистическом анализе широко используется Эмпирический коэффициент детерминации – показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака, и характеризующий силу влияния на образование общей вариации:

http://ok-t.ru/studopediaru/baza1/1076067458534.files/image084.gif

Эмпирический коэффициент детерминации показывает долю вариации результативного признака “у” под влиянием факторного признака “х” (остальная часть общей вариации “у” обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент равен нулю, а при функциональной связи – единице.

Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэффициента детерминации:

http://ok-t.ru/studopediaru/baza1/1076067458534.files/image086.gif

Оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение, как и коэффициент детерминации, может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак определяет вариацию изучаемого результативного признака.

Чем ближе к единице значение корреляционного отношения, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока:

Сила связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная

h

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

© blog.tutoronline.ru,
при полном или частичном копировании материала ссылка на первоисточник обязательна.

Остались вопросы?

Задайте свой вопрос и получите ответ от профессионального преподавателя.

Добавить комментарий