Как найти выборочный коэффициент корреляции онлайн


Инструкции:

Вы можете использовать этот пошаговый калькулятор коэффициента корреляции для двух переменных X и Y. Все, что вам нужно сделать, это ввести ваши данные X и Y, в формате через запятую или пробел (Например: “2, 3, 4, 5”, или “3 4 5 6 7”).


Калькулятор коэффициента корреляции

Рассчитанный выше коэффициент корреляции соответствует коэффициенту корреляции Пирсона. Требования для его вычисления заключаются в том, чтобы две переменные X и Y измерялись как минимум на интервальном уровне (это означает, что он не работает с номинальными или порядковыми переменными).

Формула для коэффициента корреляции Пирсона такова:

[r =frac{n sum_{i=1}^n x_i y_i – left(sum_{i=1}^n x_i right) left(sum_{i=1}^n y_i right) }{sqrt{n sum_{i=1}^n x_i^2 – left( sum_{i=1}^n x_i right)^2} sqrt{n sum_{i=1}^n y_i^2 – left( sum_{i=1}^n y_i right)^2} }]

или эквивалентно

[r = frac{sum_{i=1}^n x_i y_i – frac{1}{n}left(sum_{i=1}^n x_i right) left(sum_{i=1}^n y_i right) }{sqrt{sum_{i=1}^n x_i^2 – frac{1}{n}left( sum_{i=1}^n x_i right)^2} sqrt{sum_{i=1}^n y_i^2 – frac{1}{n}left( sum_{i=1}^n y_i right)^2}} = frac{SS_{XY}}{sqrt{SS_{XX}cdot SS_{YY} }}]

Если у вас есть две или более переменных, вы можете использовать наши

калькулятор корреляционной матрицы

. Также, если данные для переменных (X) и (Y) не удовлетворяют параметрическим предположениям для корреляции Пирсона, то следует использовать следующее

Калькулятор корреляции Спирмена

вместо этого.

Калькулятор Корреляции

Корреляция и регрессия

Корреляция и регрессия – это не одно и то же, хотя это тесно связанные понятия. Корреляционный анализ соответствует расчету коэффициента корреляции, который представляет собой значение, колеблющееся от -1 до 1, оценивающее степень линейной связи между двумя переменными.

Чем ближе по абсолютной величине

корреляция

больше 1, тем сильнее линейная связь между двумя переменными. Близкое значение к 1 указывает на тесную положительную линейную связь, а близкое к -1 – на тесную отрицательную связь

Процесс проведения корреляционного анализа часто также включает в себя

построение диаграммы рассеяния

, чтобы подтвердить информацию, полученную с помощью коэффициента коэф.

После того, как мы убедились, что корреляция близка к 1 по абсолютной величине, что диаграмма рассеяния показывает достаточно плотную линейную структуру, мы можем запустить функцию

Линейная регрессия

анализ, чтобы количественно оценить влияние независимой переменной X на зависимую переменную Y.

Могу ли я использовать z-коэффициенты для расчета коэффициента корреляции?

Конечно! Вы видели z-коэффициенты повсюду в статистике и, естественно, задаетесь вопросом, можете ли вы

вычислить корреляцию с помощью z-баллов

. Вы определенно можете это сделать, и на самом деле, это обычный способ в статистике социальных наук.

Другие калькуляторы, похожие на этот калькулятор корреляции

Кроме того, существует понятие

коэффициент множественной корреляции

, когда у вас более одного предиктора, который получается путем вычисления корреляции между наблюдаемыми значениями (Y) и предсказанными значениями (hat Y) с помощью регрессии.

The correlation is used to find the strength and direction of the relationship between the pair of variables. The deviation of two variables from their respective mean can be calculated by covariance. The square root of the variance is the standard deviation. The correlation coefficient is a normalized measurement of how the two variables are related. Enter the covariance, standard deviation of x and y in the sample correlation coefficient calculator to find the coefficient of correlation.

The correlation is used to find the strength and direction of the relationship between the pair of variables. The deviation of two variables from their respective mean can be calculated by covariance. The square root of the variance is the standard deviation. The correlation coefficient is a normalized measurement of how the two variables are related. Enter the covariance, standard deviation of x and y in the sample correlation coefficient calculator to find the coefficient of correlation.

Code to add this calci to your website Expand embed code Minimize embed code

Formula:

rxy = sxy / (sx sy)

Where,
rxy = Sample Correlation Coefficient
sx = Sample Standard Deviations of X
sy = Sample Standard Deviations of Y
sxy = Sample Covariance

Example:

A sample covariance of 20 has the standard deviation of x as 5 and standard deviation of y as 2. Find the sample correlation coefficient?

Solution:

rxy = 20 / (5 x 2)
= 2

Related Calculators:

  • Linear Regression Calculator
  • Correlation Coefficient Calculator
  • Autocorrelation Calculator
  • Regression Coefficient Confidence Interval
  • Spearman’s Rank Correlation Coefficient (RHO) Calculator
  • THC Percentage Calculator
  • Age Difference Calculator

Как найти выборочный коэффициент корреляции?

Выборочный коэффициент корреляции находится по формуле

$$r(X,Y)=frac{k(X,Y)}{sigma _x^*cdot sigma _x^*}=frac{sum n_{xy}xy-x^*y^*}{nsigma _x^*cdot sigma _y^*},$$

где   $sigma _x^*,sigma _x^*$  – выборочные средние квадратические отклонения величин $X$  и $Y$ .

Выборочная ковариация $k(X,Y)$  величин $X$ и $Y$  определяется формулой

$$k(X,Y)=frac{1}{n}sum (x_i-x^*)(y_i-y^*)n_{xy},$$

где$n=sum n_{xy}$ , а $ x^*$,$y^*$ – выборочные средние величин $X$  и $Y$

Выборочный коэффициент корреляции $r(X,Y)$ показывает тесноту линейной связи между $X$  и $Y$ : чем ближе $r(X,Y)$ к единице, тем сильнее линейная связь между $X$  и $Y$
 

Пример 1. Среднемесячная заработная плата (тыс. руб.) в Ярославской области в 2001-2002 годах составила по отраслям:

отрасль ЖКХ здравоохранение наука образование транспорт промышленность
2001 год 2 1,5 2,7 1,3 3,2 3,2
2002 год 3 2,8 3,6 2,4 4,9 4,5

Найдите выборочный коэффициент корреляции для заработной платы в указанные годы.

Решение. 1). Найдем выборочные средние

$x^*=frac{1}{6}(2+1,5+2,7+1,3+3,2+3,2)approx 2,3;; ; ; y^*approx 3,5.$

2). Вычислим выборочную ковариацию

$k(X,Y)=frac{1}{6}[ (2-3,5)cdot (3-3,5)+(1,5-2,3)cdot (2,8-3,5)+(2,7-2,3)cdot (3,6-3,5)+$
$(1,3-2,3)cdot (2,4-3,5)+(3,2-2,3)cdot (4,9-3,5)+(3,2-2,3)cdot (4,5-3,5)  ]=0,668$

3). Найдем выборочные средние квадратические отклонения:

$D_{x}^{*}= frac{1}{6}left [ (-0,3)^2+(0,8)^2+0,4^2+1^2+0,9^2cdot2 right]=0,585sigma_x^*=sqrt{D_x^*}=0,765;$

$D_{y}^{*}=0,82;; ; sigma _y^*=0,91$

4). Вычислим теперь выборочный коэффициент корреляции

$$r(X,Y)=frac{k(X,Y)}{sigma _x^*cdot sigma _x^*}=frac{0,668}{0,765cdot 0,91}approx 0,96$$

Поскольку $r(X,Y)$ достаточно близко к $1$, то между заработной платой по отраслям в 2001 и 2002 годах существовала почти линейная зависимость (зарплата в 2002 году по каждой отрасли увеличилась примерно в 1,5 раза).

Понятие корреляции является одним из основных понятий теории вероятностей и математической статистики, оно было введено Гальтоном и Пирсоном.

Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы. В данном разделе рассмотрена теснота статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа.

В качестве измерителей степени тесноты парных связей между количественными переменными используются коэффициент корреляции (или то же самое “коэффициент корреляции Пирсона”) и корреляционное отношение.

Линейный коэффициент корреляции

Краткая теория


Под теснотой связи между
двумя величинами понимают степень сопряженности между ними, которая
обнаруживается с изменением изучаемых величин. Если каждому заданному
значению 

 соответствуют
близкие друг другу значения

, то связь считается тесной (сильной); если
же значения

 сильно
разбросаны, то связь считается менее тесной.

Рассмотрим наиболее важный
для практики и теории случай линейной зависимости вида:

При тесной корреляционной
связи корреляционное поле представляет собой более или менее сжатый эллипс. Две
корреляционные зависимости переменной

 от

 приведены на рисунке.

Очевидно, что в случае (а)
зависимость между переменными менее тесная, чем в случае (б), так как точки
корреляционного поля (а) дальше отстоят от линии регрессии, чем точки поля (б).

Перейдем к оценке тесноты
линейной корреляционной зависимости. Для показателя тесноты связи нужная такая
стандартная система единиц измерения, в которой данные по различным
характеристикам оказались бы сравнимы между собой. Статистика знает такую
систему единиц. Эта система использует в качестве единицы измерения переменной
ее среднее квадратическое отклонение

.

Учтем, что

и запишем
уравнение парной линейной зависимости

в эквивалентном виде:

В этой системе величина:

показывает, на сколько
величин

 изменится
в среднем

, когда

 увеличится
на одно

.

Величина

 является
показателем тесноты связи и называется линейным коэффициентом корреляции. Коэффициент
корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции.

Если

, то корреляционная связь между переменными
называется прямой, если

 – обратной.

Приведем другие модификации
формулы для расчета линейного коэффициента корреляции:

или

Наиболее часто для расчета
используют формулу, получаемую простыми преобразованиями:

По этой формуле

 находится
непосредственно из данных наблюдений и на значении

 не
скажутся округления данных, связанных с расчетом средних и дисперсий.

Линейный выборочный
коэффициент корреляции

 (при
достаточно большом объеме выборки

) обладает следующими свойствами:

    Коэффициент корреляции
    принимает значения на отрезке

    , т.е.

    . При этом, чем ближе по модулю

     к
    единице – тем теснее связь.
    При

     корреляционная
    связь представляет собой линейную функциональную зависимость. При этом все
    наблюдаемые значения располагаются на прямой линии.
    При

      линейная
    корреляционная связь отсутствует. При этом линия регрессии параллельна  оси

    .

Расчет линейного коэффициента корреляции предполагает, что
переменные

 и

 распределены нормально. В других случаях
(когда распределения

 и

 отклоняются от нормальных) линейный
коэффициент корреляции не следует рассматривать как строгую меру взаимосвязи
переменных.

Пример решения задачи


Задача

Компания,
занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон
определенной модели цену, дифференцированную по регионам. Следующие данные
показывают цены на видеомагнитофон в 10 различных регионах о соответствующее им
число продаж:

Число продаж,
шт.
420 380 350 400 440 380 450 425 430 480
Цена, тыс.руб. 5.6 6.0 6.5 6.0 5.0 6.4 4.5 5.0 5.7 4.4

Рассчитайте
выборочный коэффициент линейной корреляции и проверьте его значимость
при

.

Решение

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Составим
расчетную таблицу:

Вычислим
линейный коэффициент корреляции:

Вывод

Связь
между числом продаж и ценой очень тесная, обратная – с уменьшением цены
увеличивается объем продаж.

Проверим
значимость коэффициента корреляции:

По таблице критических точек t-критерия Стьюдента (по уровню значимости

 и числу степеней свободы

)  находим:

  – коэффициент корреляции значим.

Кроме этой задачи на другой странице сайта есть еще

задача на расчет коэффициента корреляции, коэффициента детерминации, построение линии линейной регрессии и корреляционного поля.

коэффициент корреляции калькулятор

Коэффициент корреляции – это мера зависимости двух или более величин. Его еще называют коэффициентом взаимной корреляции. Он может отличаться от -1 до +1. -1 обозначает совершенно отрицательную корреляцию (если одна величина увеличивается, другая уменьшается), а +1 обозначает совершенно положительную корреляцию (если одна величина увеличивается, то и другая увеличивается). На этом статистическом калькуляторе рассчитывается коэффициент корреляции между известными переменными величинами X и Y.

Калькулятор коэффициента корреляции

Коэффициент корреляции – это мера зависимости двух или более величин. Его еще называют коэффициентом взаимной корреляции. Он может отличаться от -1 до +1. -1 обозначает совершенно отрицательную корреляцию (если одна величина увеличивается, другая уменьшается), а +1 обозначает совершенно положительную корреляцию (если одна величина увеличивается, то и другая увеличивается). На этом статистическом калькуляторе рассчитывается коэффициент корреляции между известными переменными величинами X и Y.

Корреляция коэффициентом Формула :

корреляция(r) = NΣXY – (ΣX)(ΣY) / Sqrt([NΣX2 – (ΣX)2][NΣY2 – (ΣY)2])

где,

N = Количество значений или элементов
X = Первый счет
Y = Во-вторых Оценка
ΣXY = Сумма продукта из первого и второго счеты
ΣX = Сумма первых рекорды
ΣY = Сумма второго рекорды
ΣX2 = Сумма квадратных первой набирает
ΣY2 = Сумма квадратных второго рекорды

Этот инструмент поможет вам динамически решать статистические задачи. Расчет коэффициента корреляции значительно облегчен.

Добавить комментарий