Пусть требуется
по данным корреляционной таблицы найти
выборочное уравнение прямой линии
регрессии Y
на Х.
Вычислим сначала
выборочный коэффициент корреляции.
Можно значительно упростить расчет,
если к условным вариантам (при этом
величина
не изменится)
и
В этом случае
выборочный коэффициент корреляции
вычисляют по формуле
Величины
,
,
и
можно найти методом
произведения, а при малом числе данных
– непосредственно исходя из определенных
этих величин. Остается указать способ
вычисления
,
где
– частота пары условных вариант (
,
).
Можно доказать,
что справедливы формулы:
,
где
,
,
где
.
Для контроля
целесообразно вычислить расчеты по
обеим формулам и сравнить результаты;
их совпадения свидетельствуют о
правильности вычислений.
Напишем искомое
уравнения в общем виде:
. (*)
Поскольку при
нахождении
уже вычислены
,
,
,
,
то целесообразно
пользоваться формулами:
,
,
,
.
Пример. Найти
выборочное уравнение прямой линии
регрессии Y на X
по данным корреляционной таблицы
Y |
X |
||||||
10 |
20 |
30 |
40 |
50 |
60 |
||
15 |
5 |
7 |
– |
– |
– |
– |
12 |
25 |
– |
20 |
23 |
– |
– |
– |
43 |
35 |
– |
– |
30 |
47 |
2 |
– |
79 |
45 |
– |
– |
10 |
11 |
20 |
6 |
47 |
55 |
– |
– |
– |
9 |
7 |
3 |
19 |
5 |
27 |
63 |
67 |
29 |
9 |
n=200 |
Решение.
Перейдем к условным вариантам:
(в качестве ложного нуля
взята варианта
x=40,
расположенная примерно в середине
вариационного ряда; шаг
равен разности
между двумя соседними вариантами:
20–10=10) и
(в
качестве ложного нуля
взята варианта y=35,
расположенная в середине вариационного
ряда; шаг
равен разности
между двумя соседними вариантами:
25–15=10).
Составим
корреляционную таблицу в условных
вариантах. Практически этоо делают так:
в первом столбце вместо ложного нуля
(варианты 35) пишут 0; над нулем последовательно
записывают –1, –2; под нулем пишут 1, 2. В
первой строке вместо ложного нуля
(варианты 40) пишут 0; слева от нуля
последовательно записывают –1, –2, –3;
справа от нуля пишут 1, 2. все остальные
данные переписываются из первоначальной
корреляционной таблицы. В итоге получим
корреляционную таблицу в условных
вариантах.
|
|
|
|||||
–3 |
–2 |
–1 |
0 |
1 |
2 |
||
–2 |
5 |
7 |
– |
– |
– |
– |
12 |
–1 |
– |
20 |
23 |
– |
– |
– |
43 |
0 |
– |
– |
30 |
47 |
2 |
– |
79 |
1 |
– |
– |
10 |
11 |
20 |
6 |
47 |
2 |
– |
– |
– |
9 |
7 |
3 |
19 |
|
5 |
27 |
63 |
67 |
29 |
9 |
n=200 |
Теперь для вычисления
искомой суммы
составим расчетную таблицу. Пояснения
к составлению таблицы.
-
В каждой клетке,
в которой частота
записывают в правом верхнем углу
произведение частоты
на варианту
.
Например, в правых верхних углах клеток
первой строки записаны произведения:
5*(–3)=–15; 7*(–2)=14. -
Складывают все
числа, помещенные в правых верхних
углах клеток одной строки и их суму
записывают в клетку этой же строки
столбца
.
Например, для первой строки=–15+(–14)=–29.
-
Умножают варианту
на
и полученное произведение записывают
в последнюю клетку той же строки, то
естьв клетку столбца.
Например, в первой строке таблицы=–2,
=–29;
следовательно,=(–2)*(–29)=58.
-
Наконец, сложив
все числа столбца
,
получаем сумму
,
которая равна искомой сумме.
Например, для таблицы имеем
;
следовательно, искомая сумма
.
|
|
|||||||
–3 |
–2 |
–1 |
0 |
1 |
2 |
|||
–2 |
–15 5 –10 |
–14 7 –14 |
– |
– |
– |
– |
–29 |
58 |
–1 |
– |
–40 20 –20 |
–23 23 –23 |
– |
– |
– |
–63 |
63 |
0 |
– |
– |
–30 30 0 |
0 47 0 |
2 2 0 |
– |
–28 |
0 |
1 |
– |
– |
–10 10 10 |
0 11 11 |
20 20 20 |
12 6 6 |
22 |
22 |
2 |
– |
– |
– |
0 9 18 |
7 7 14 |
6 3 6 |
13 |
26 |
|
–10 |
–34 |
–13 |
29 |
34 |
12 |
|
|
|
30 |
68 |
13 |
0 |
34 |
24 |
|
|
Для контроля
аналогичные вычисления производят по
столбцам: произведения
записывают в левый нижний угол клетки,
содержащей частоту
;
все числа, помещенные в левых нижних
углах клеток одного столбца, складывают
и их сумму записывают в строку V;
далее умножают каждую варианту
на V
и результат
записывают в клетках последней строки.
Наконец, сложив
все числа последней строки, получают
сумму
,
которая также
равна искомой сумме
.
Например, для таблицы имеем
;
следовательно,
.
Величины
,
,
и
можно вычислить
методом произведений; однако, поскольку
числа
,
малы, вычислим
и
,
исходя из определения средней, а
и
– используя
формулы:
,
.
Найдем
и
:
Вычислим
вспомогательную величину
,
а затем
:
Аналогично получим
Найдем искомый
выборочный коэффициент корреляции,
учитывая, что ранее уже вычислена сумма
:
Итак,
Остается найти
,
,
и
:
;
.
Поставим найденные
величины в уравнение (*), получим искомое
уравнение
,
или окончательно
.
Сравним условные
средние, вычисленные: а) по этому
уравнению; б) по данным корреляционной
таблицы. Например, при х=30:
а)
;
б)
.
Как видим,
согласование расчетного и наблюдаемого
условных средних – удовлетворительное.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Корреляционная таблица
Пример 1 . По данной корреляционной таблице построить прямые регрессии с X на Y и с Y на X . Найти соответствующие коэффициенты регрессии и коэффициент корреляции между X и Y .
y/x | 15 | 20 | 25 | 30 | 35 | 40 |
100 | 2 | 2 | ||||
120 | 4 | 3 | 10 | 3 | ||
140 | 2 | 50 | 7 | 10 | ||
160 | 1 | 4 | 3 | |||
180 | 1 | 1 |
Решение:
Уравнение линейной регрессии с y на x будем искать по формуле
а уравнение регрессии с x на y, использовав формулу:
где x x , y – выборочные средние величин x и y, σx, σy – выборочные среднеквадратические отклонения.
Находим выборочные средние:
x = (15(1 + 1) + 20(2 + 4 + 1) + 25(4 + 50) + 30(3 + 7 + 3) + 35(2 + 10 + 10) + 40(2 + 3))/103 = 27.961
y = (100(2 + 2) + 120(4 + 3 + 10 + 3) + 140(2 + 50 + 7 + 10) + 160(1 + 4 + 3) + 180(1 + 1))/103 = 136.893
Выборочные дисперсии:
σ 2 x = (15 2 (1 + 1) + 20 2 (2 + 4 + 1) + 25 2 (4 + 50) + 30 2 (3 + 7 + 3) + 35 2 (2 + 10 + 10) + 40 2 (2 + 3))/103 – 27.961 2 = 30.31
σ 2 y = (100 2 (2 + 2) + 120 2 (4 + 3 + 10 + 3) + 140 2 (2 + 50 + 7 + 10) + 160 2 (1 + 4 + 3) + 180 2 (1 + 1))/103 – 136.893 2 = 192.29
Откуда получаем среднеквадратические отклонения:
и
Определим коэффициент корреляции:
где ковариация равна:
Cov(x,y) = (35•100•2 + 40•100•2 + 25•120•4 + 30•120•3 + 35•120•10 + 40•120•3 + 20•140•2 + 25•140•50 + 30•140•7 + 35•140•10 + 15•160•1 + 20•160•4 + 30•160•3 + 15•180•1 + 20•180•1)/103 – 27.961 • 136.893 = -50.02
Запишем уравнение линий регрессии y(x):
и уравнение x(y):
Построим найденные уравнения регрессии на чертеже, из которого сделаем следующие вывод:
1) обе линии проходят через точку с координатами (27.961; 136.893)
2) все точки расположены близко к линиям регрессии.
Пример 2 . По данным корреляционной таблицы найти условные средние y и x . Оценить тесноту линейной связи между признаками x и y и составить уравнения линейной регрессии y по x и x по y . Сделать чертеж, нанеся его на него условные средние и найденные прямые регрессии. Оценить силу связи между признаками с помощью корреляционного отношения.
Корреляционная таблица:
X / Y | 2 | 4 | 6 | 8 | 10 |
1 | 5 | 4 | 2 | 0 | 0 |
2 | 0 | 6 | 3 | 3 | 0 |
3 | 0 | 0 | 1 | 2 | 3 |
5 | 0 | 0 | 0 | 0 | 1 |
Уравнение линейной регрессии с y на x имеет вид:
Уравнение линейной регрессии с x на y имеет вид:
найдем необходимые числовые характеристики.
Выборочные средние:
x = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 5.53
y = (2(5) + 4(4 + 6) + 6(2 + 3 + 1) + 8(3 + 2) + 10(3 + 1) + )/30 = 1.93
Дисперсии:
σ 2 x = (2 2 (5) + 4 2 (4 + 6) + 6 2 (2 + 3 + 1) + 8 2 (3 + 2) + 10 2 (3 + 1))/30 – 5.53 2 = 6.58
σ 2 y = (1 2 (5 + 4 + 2) + 2 2 (6 + 3 + 3) + 3 2 (1 + 2 + 3) + 5 2 (1))/30 – 1.93 2 = 0.86
Откуда получаем среднеквадратические отклонения:
σx = 2.57 и σy = 0.93
и ковариация:
Cov(x,y) = (2•1•5 + 4•1•4 + 6•1•2 + 4•2•6 + 6•2•3 + 8•2•3 + 6•3•1 + 8•3•2 + 10•3•3 + 10•5•1)/30 – 5.53 • 1.93 = 1.84
Определим коэффициент корреляции:
Запишем уравнения линий регрессии y(x):
и вычисляя, получаем:
yx = 0.28 x + 0.39
Запишем уравнения линий регрессии x(y):
и вычисляя, получаем:
xy = 2.13 y + 1.42
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (5.53; 1.93) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=30-m-1 = 28 находим tкрит:
tкрит (n-m-1;α/2) = (28;0.025) = 2.048
где m = 1 – количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически – значим.
Пример 3 . Распределение 50 предприятий пищевой промышленности по степени автоматизации производства Х (%) и росту производительности труда Y (%) представлено в таблице. Необходимо:
1. Вычислить групповые средние i и j x y, построить эмпирические линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
б) вычислить коэффициент корреляции; на уровне значимости α= 0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными Х и Y;
в) используя соответствующее уравнение регрессии, оценить рост производительности труда при степени автоматизации производства 43%.
Скачать решение
Пример . По корреляционной таблице рассчитать ковариацию и коэффициент корреляции, построить прямые регрессии.
Пример 4 . Найти выборочное уравнение прямой Y регрессии Y на X по данной корреляционной таблице.
Решение находим с помощью калькулятора.
Скачать
Пример №4
Пример 5 . С целью анализа взаимного влияния прибыли предприятия и его издержек выборочно были проведены наблюдения за этими показателями в течение ряда месяцев: X – величина месячной прибыли в тыс. руб., Y – месячные издержки в процентах к объему продаж.
Результаты выборки сгруппированы и представлены в виде корреляционной таблицы, где указаны значения признаков X и Y и количество месяцев, за которые наблюдались соответствующие пары значений названных признаков.
Решение.
Пример №5
Пример №6
Пример №7
Пример 6 . Данные наблюдений над двумерной случайной величиной (X, Y) представлены в корреляционной таблице. Методом наименьших квадратов найти выборочное уравнение прямой регрессии Y на X. Построить график уравнения регрессии и показать точки (x;y)б рассчитанные по таблице данных.
Решение.
Скачать решение
Пример 7 . Дана корреляционная таблица для величин X и Y, X- срок службы колеса вагона в годах, а Y – усредненное значение износа по толщине обода колеса в миллиметрах. Определить коэффициент корреляции и уравнения регрессий.
X / Y | 0 | 2 | 7 | 12 | 17 | 22 | 27 | 32 | 37 | 42 |
0 | 3 | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 25 | 108 | 44 | 8 | 2 | 0 | 0 | 0 | 0 | 0 |
2 | 30 | 50 | 60 | 21 | 5 | 5 | 0 | 0 | 0 | 0 |
3 | 1 | 11 | 33 | 32 | 13 | 2 | 3 | 1 | 0 | 0 |
4 | 0 | 5 | 5 | 13 | 13 | 7 | 2 | 0 | 0 | 0 |
5 | 0 | 0 | 1 | 2 | 12 | 6 | 3 | 2 | 1 | 0 |
6 | 0 | 1 | 0 | 1 | 0 | 0 | 2 | 1 | 0 | 1 |
7 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 |
Решение.
Скачать решение
Пример 8 . По заданной корреляционной таблице определить групповые средние количественных признаков X и Y. Построить эмпирические и теоретические линии регрессии. Предполагая, что между переменными X и Y существует линейная зависимость:
- Вычислить выборочный коэффициент корреляции и проанализировать степень тесноты и направления связи между переменными.
- Определить линии регрессии и построить их графики.
Скачать
Выборочное уравнение прямой линии регрессии
Рассмотрим выборочное уравнение прямой линии среднеквадратичной регрессии Y на X в виде
, (7.3)
где – угловой коэффициент прямой линии регрессии, который называют выборочным коэффициентом регрессии Y на X; он является оценкой коэффициента регрессии (раздел 4.4).
Подберём параметры и b таким образом, чтобы точки , ,…, , построенные на плоскости XоY, лежали как можно ближе к прямой (7.3).
При использовании метода наименьших квадратов (МНК) смысл этого требования интерпретируется так: сумма квадратов отклонений должна быть минимальной. Под отклонением понимают разность , , где – вычисленная по уравнению (7.3) ордината наблюдаемого значения ; – наблюдаемая ордината, соответствующая .
Запишем это требование в виде функции:
.
Для отыскания минимума функции приравняем нулю соответствующие частные производные
;
.
Выполнив преобразования, получим систему
Решив данную систему, найдём искомые параметры
;
. (7.4)
Аналогично можно найти выборочное уравнение прямой линии регрессии X на Y.
. (7.5)
Пример. Найти уравнение прямой линии регрессии по данным наблюдений:
X | 1,00 | 1,50 | 3,00 | 4,50 | 5,00 |
Y | 1,25 | 1,40 | 1,50 | 1,75 | 2,25 |
Составляем расчётную таблицу:
1,00 | 1,25 | 1,00 | 1,250 |
1,50 | 1,40 | 2,25 | 2,100 |
3,00 | 1,50 | 9,00 | 4,500 |
4,50 | 1,75 | 20,25 | 4,875 |
5,00 | 2,25 | 25,00 | 11,250 |
Находим неизвестные параметры из уравнения прямой линии регрессии:
;
.
Записываем искомое уравнение:
.
Если данные наблюдений представлены в виде корреляционнной таблицы 6.1, то можно вычислить по формуле
. (7.6)
Умножим обе части равенства (7.6) на дробь , получим формулу (6.3) для вычисления rв.
. (7.7)
Отсюда уравнение (7.3) можно записать через rв:
. (7.8)
Аналогично уравнение (7.5) примет вид
. (7.9)
Выборочное уравнение нелинейной регрессии
Функции регрессии Y на X могут иметь вид, например, параболической корреляции второго порядка
, (7.10)
параболической корреляции третьего порядка
,
где A, B, C, D – неизвествные параметры.
Определить неизвестные параметры можно МНК. Для уравнения (7.9) неизвестные параметры A, B, C находят из решения системы линейных уравнений:
Пример. В. Е. Гмурман «Руководство к решению задач по теории вероятностей и математической статистике», стр. 276.
Элементы дисперсионного анализа
Общие сведения
Дисперсионный анализ применяют, чтобы установить:
– оказывает ли существенное влияние некоторый качественный фактор , который имеет уровней на изучаемую величину ;
– являются ли однородными несколько совокупностей, т.к. однородные совокупности можно объединить в одну и тем самым получить о ней более полную информацию.
Суть дисперсионного анализасостоит в сравнении «факторной дисперсии» (т.е. межгрупповой), обусловленной воздействием фактора, и «остаточной дисперсии» (т.е. внутригрупповой), порождаемой случайными причинами по критерию Фишера-Снедекора.
Различают дисперсионный анализ:
– однофакторный, если исследуется влияние одного фактора на изучаемую СВ;
– многофакторный, если исследуется воздействие нескольких факторов.
Рассмотрим случай однофакторного дисперсионного анализа, когда на изучаемую величину влияет только один фактор, который имеет постоянных уровней.
Решения задач: линейная регрессия и коэффициент корреляции
Парная линейная регрессия – это зависимость между одной переменной и средним значением другой переменной. Чаще всего модель записывается как $y=ax+b+e$, где $x$ – факторная переменная, $y$ – результативная (зависимая), $e$ – случайная компонента (остаток, отклонение).
В учебных задачах по математической статистике обычно используется следующий алгоритм для нахождения уравнения регрессии.
- Выбор модели (уравнения). Часто модель задана заранее (найти линейную регрессию) или для подбора используют графический метод: строят диаграмму рассеяния и анализируют ее форму.
- Вычисление коэффициентов (параметров) уравнения регрессии. Часто для этого используют метод наименьших квадратов.
- Проверка значимости коэффициента корреляции и параметров модели (также для них можно построить доверительные интервалы), оценка качества модели по критерию Фишера.
- Анализ остатков, вычисление стандартной ошибки регрессии, прогноз по модели (опционально).
Ниже вы найдете решения для парной регрессии (по рядам данных или корреляционной таблице, с разными дополнительными заданиями) и пару задач на определение и исследование коэффициента корреляции.
Примеры решений онлайн: линейная регрессия
Простая выборка
Пример 1. Имеются данные средней выработки на одного рабочего Y (тыс. руб.) и товарооборота X (тыс. руб.) в 20 магазинах за квартал. На основе указанных данных требуется:
1) определить зависимость (коэффициент корреляции) средней выработки на одного рабочего от товарооборота,
2) составить уравнение прямой регрессии этой зависимости.
Пример 2. С целью анализа взаимного влияния зарплаты и текучести рабочей силы на пяти однотипных фирмах с одинаковым числом работников проведены измерения уровня месячной зарплаты Х и числа уволившихся за год рабочих Y:
X 100 150 200 250 300
Y 60 35 20 20 15
Найти линейную регрессию Y на X, выборочный коэффициент корреляции.
Пример 3. Найти выборочные числовые характеристики и выборочное уравнение линейной регрессии $y_x=ax+b$. Построить прямую регрессии и изобразить на плоскости точки $(x,y)$ из таблицы. Вычислить остаточную дисперсию. Проверить адекватность линейной регрессионной модели по коэффициенту детерминации.
Пример 4. Вычислить коэффициенты уравнения регрессии. Определить выборочный коэффициент корреляции между плотностью древесины маньчжурского ясеня и его прочностью.
Решая задачу необходимо построить поле корреляции, по виду поля определить вид зависимости, написать общий вид уравнения регрессии Y на Х, определить коэффициенты уравнения регрессии и вычислить коэффициенты корреляции между двумя заданными величинами.
Пример 5. Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей X и стоимостью ежемесячного технического обслуживания Y. Для выяснения характера этой связи было отобрано 15 автомобилей. Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
Корреляционная таблица
Пример 6. Найти выборочное уравнение прямой регрессии Y на X по заданной корреляционной таблице
Пример 7. В таблице 2 приведены данные зависимости потребления Y (усл. ед.) от дохода X (усл. ед.) для некоторых домашних хозяйств.
1. В предположении, что между X и Y существует линейная зависимость, найдите точечные оценки коэффициентов линейной регрессии.
2. Найдите стандартное отклонение $s$ и коэффициент детерминации $R^2$.
3. В предположении нормальности случайной составляющей регрессионной модели проверьте гипотезу об отсутствии линейной зависимости между Y и X.
4. Каково ожидаемое потребление домашнего хозяйства с доходом $x_n=7$ усл. ед.? Найдите доверительный интервал для прогноза.
Дайте интерпретацию полученных результатов. Уровень значимости во всех случаях считать равным 0,05.
Пример 8. Распределение 100 новых видов тарифов на сотовую связь всех известных мобильных систем X (ден. ед.) и выручка от них Y (ден.ед.) приводится в таблице:
Необходимо:
1) Вычислить групповые средние и построить эмпирические линии регрессии;
2) Предполагая, что между переменными X и Y существует линейная корреляционная зависимость:
А) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
Б) вычислить коэффициент корреляции, на уровне значимости 0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными X и Y;
В) используя соответствующее уравнение регрессии, оценить среднюю выручку от мобильных систем с 20 новыми видами тарифов.
Коэффициент корреляции
Пример 9. На основании 18 наблюдений установлено, что на 64% вес X кондитерских изделий зависит от их объема Y. Можно ли на уровне значимости 0,05 утверждать, что между X и Y существует зависимость?
Пример 10. Исследование 27 семей по среднедушевому доходу (Х) и сбережениям (Y) дало результаты: $overline=82$ у.е., $S_x=31$ у.е., $overline=39$ у.е., $S_y=29$ у.е., $overline =3709$ (у.е.)2. При $alpha=0,05$ проверить наличие линейной связи между Х и Y. Определить размер сбережений семей, имеющих среднедушевой доход $Х=130$ у.е.
[spoiler title=”источники:”]
http://megaobuchalka.ru/5/3761.html
http://www.matburo.ru/ex_ms.php?p1=mslr
[/spoiler]
- Главная
- Полезные советы
- Найти выборочное уравнение прямой линии регрессии.
Найти выборочное уравнение прямой линии регрессии.
Найти выборочное уравнение прямой линии регрессии y на x по данной корреляционной таблице
Решение:
Найдем:
Таким образом, выборочное уравнение прямой линии регрессии y на x имеет вид
Если испытываете трудности в написании курсовой работы по статистике, оформите заявку и Вы узнаете сроки и стоимость работы. Цена – от 99 рублей.
Продолжаем анализировать ответы к индивидуальным заданиям по теории вероятностей. Из этой статьи Вы научитесь составлять (строить) уравнение прямой регрессии Y на X (y=alpha*x+beta ). Такие примеры распространены в теории вероятностей для студентов экономических факультета и статистики. Приведенные решения взяты из программы для экономистов ЛНУ им. И.Франка. ВУЗы Киева, Одессы, Харькова и других городов Украины имеют подобную систему обучения, поэтому много полезного для себя должен взять каждый студент.
Индивидуальное задание 1
Вариант 11
Задача 1. Связь между признаками Х и Y генеральной совокупности задается таблицей:
Записать выборочное уравнение прямой регрессии Y на X.
Решение: Вычисляем средние арифметические значения признаков Х та Y
Находим величины которые фигурируют в уравнении регрессии – alpha, beta
После вычислений выборочное уравнение регрессии Y на X записываем по формуле
y=2,02*x-0,99.
Чтобы подтвердить правильность предположения о линейности связи между признаками Х и Y находим выборочный коэффициент корреляции по формуле:
Так как выборочный коэффициент корреляции r(X,Y) является достаточно близким к единице, то предположение о линейной зависимости между X и Y – правильное. Кроме этого коэффициент корреляции положительный r>0, поэтому случайные величины X и Y увеличиваются одновременно.
Вариант 1
Задача 1. Связь между признаками Х и Y генеральной совокупности задается таблицей:
Записать выборочное уравнение прямой регрессии Y на X.
Решение: Находим величины которые необходимы для вычисления коэффициентов уравнения регрессии
Вычисляем alpha, beta
и составляем уравнение регрессии Y на X
y=19,7*x+0,935.
Xтобы убедиться что предположение о линейной свя связи между Х и Y является правильным, находим выборочный коэффициент корреляции по формуле:
Поскольку выборочный коэффициент корреляции =0,9962 достаточно близок к единице, то предположение о линейной связи между X и Y -правильное.
К тому же коэффициент корреляции положительный (r>0), поэтому и связь между X и Y является положительной, то есть эти случайные величины увеличиваются одновременно.
Вариант-12
Задача 1. Связь между признаками Х и Y генеральной совокупности задается таблицей:
Записать выборочное уравнение прямой регрессии Y на X.
Решение: Вычисляем средние арифметические значения каждой из выборок, а также остальные составляющие для построения уравнения регрессии Y на X:
Находим коэффициенты alpa, beta по формулам
Подставляем коэффициенты в уравнение прямой регрессии y=2,01*x+1,335.
Находим точечную оценку для коэффициента корреляции по формуле:
Поскольку выборочный коэффициент корреляции достаточно близок к единице то предположение о линейной зависимости между X и Y – правильное.
Также r>0, поэтому связь между X и Y положительная и эти случайные величины увеличиваются одновременно.
Теперь Вы знаете, как составить уравнение прямой регрессии Y на X .
Готовые решения по теории вероятностей
- Предыдущая статья – Формулы числовых характеристик статистического распределения
- Следующая статья – Как найти доверительный интервал?