Относительная частота в выборке как найти


Загрузить PDF


Загрузить PDF

С абсолютной частотой все довольно просто: она определяет, сколько раз конкретное число содержится в имеющемся наборе данных (объектов или значений). А вот относительная частота характеризует отношение количества конкретного числа в наборе данных. Другими словами, относительная частота – это отношение количества определенного числа к общему количеству чисел в наборе данных. Имейте в виду, что вычислить относительную частоту достаточно легко.

  1. Изображение с названием Calculate Relative Frequency Step 1

    1

    Соберите данные. Если вы решаете математическую задачу, в ее условии должен быть дан набор данных (чисел). В противном случае проведите эксперимент или исследование и соберите необходимые данные. Подумайте, в какой форме записать исходные данные.

    • Например, нужно собрать данные о возрасте людей, которые посмотрели определенный фильм. Конечно, можно записать точный возраст каждого человека, но в этом случае вы получите довольно большой набор данных с 60-70 числами в пределах от 10 до 70 или 80. Поэтому лучше сгруппировать данные по категориям, таким как «Моложе 20», «20-29», «30-39» «40-49», «50-59» и «Старше 60». Получится упорядоченный набор данных с шестью группами чисел.
    • Другой пример: врач собирает данные о температуре пациентов в определенный день. Если записать округленные числа, например, 37, 38, 39, то результат будет не слишком точным, поэтому здесь данные нужно представить в виде десятичных дробей.
  2. Изображение с названием Calculate Relative Frequency Step 2

    2

    Упорядочьте данные. Когда вы соберете данные, у вас, скорее всего, получится хаотичный набор чисел, например, такой: 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. Такая запись кажется практически бессмысленной и с ней сложно работать. Поэтому упорядочьте числа по возрастанию (от меньшего к большему), например, так: 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.[1]

    • Упорядочивая данные, будьте внимательны, чтобы не пропустить ни одного числа. Посчитайте общее количество чисел в наборе данных, чтобы убедиться, что вы записали все числа.
  3. Изображение с названием Calculate Relative Frequency Step 3

    3

    Создайте таблицу с данными. Собранные данные можно организовать в виде таблицы. Такая таблица будет включать три столбца и использоваться для вычисления относительной частоты. Столбцы обозначьте следующим образом:[2]

    Реклама

  1. Изображение с названием Calculate Relative Frequency Step 5

    1

    Найдите количество чисел в наборе данных. Относительная частота характеризует, сколько раз конкретное число содержится в имеющемся наборе данных по отношению к общему количеству чисел. Чтобы найти относительную частоту, нужно посчитать общее количество чисел в наборе данных. Общее количество чисел станет знаменателем дроби, с помощью которой будет вычислена относительная частота.[3]

    • В нашем примере набор данных содержит 16 чисел.
  2. Изображение с названием Calculate Relative Frequency Step 5

    2

    Найдите количество определенного числа. То есть посчитайте, сколько раз конкретное число встречается в наборе данных. Это можно сделать как для одного числа, так и для всех чисел из набора данных.[4]

    • Например, в нашем примере число 4 встречается в наборе данных три раза.
  3. Изображение с названием Calculate Relative Frequency Step 6

    3

    Разделите количество конкретного числа на общее количество чисел. Так вы найдете относительную частоту для определенного числа. Вычисление можно представить в виде дроби или воспользоваться калькулятором или электронной таблицей, чтобы разделить два числа.[5]

    Реклама

  1. Изображение с названием Calculate Relative Frequency Step 7

    1

    Результаты вычислений запишите в созданную ранее таблицу. Она позволит представить результаты в наглядной форме. По мере вычисления относительной частоты результаты записывайте в таблицу напротив соответствующего числа. Как правило, значение относительной частоты можно округлить до второго знака после десятичной запятой, но это на ваше усмотрение (в зависимости от требований задачи или исследования). Помните, что округленный результат не равен точному ответу.[6]

    • В нашем примере таблица относительных частот будет выглядеть следующим образом:
    • x : n(x) : P(x)
    • 1 : 3 : 0,19
    • 2 : 1 : 0,06
    • 3 : 2 : 0,13
    • 4 : 3 : 0,19
    • 5 : 4 : 0,25
    • 6 : 2 : 0,13
    • 7 : 1 : 0,06
    • Итого : 16 : 1,01
  2. Изображение с названием Calculate Relative Frequency Step 8

    2

    Представьте числа (элементы), которых нет в наборе данных. Иногда представление чисел с нулевой частотой так же важно, как и представление чисел с ненулевой частотой. Обратите внимание на собранные данные; если между данными имеются пробелы, их нужно заполнить нулями.

    • В нашем примере набор данных включает все числа от 1 до 7. Но предположим, что числа 3 нет в наборе. Возможно, это немаловажный факт, поэтому нужно записать, что относительная частота числа 3 равна 0.
  3. Изображение с названием Calculate Relative Frequency Step 9

    3

    Выразите результаты в процентах. Иногда результаты вычислений нужно преобразовать из десятичных дробей в проценты. Это общепринятая практика, потому что относительная частота характеризует процент случаев появления определенного числа в наборе данных. Чтобы преобразовать десятичную дробь в проценты, нужно десятичную запятую передвинуть на две позиции вправо и приписать символ процента.

    • Например, десятичная дробь 0,13 равна 13%.
    • Десятичная дробь 0,06 равна 6% (обратите внимание, что перед 6 стоит 0).

    Реклама

Советы

  • Относительная частота характеризует наличие или возникновение определенного события в наборе событий.
  • Если сложить относительные частоты всех чисел из набора данных, вы получите единицу. Помните, что при сложении округленных результатов сумма не будет равна 1,0.
  • Если набор данных слишком большой, чтобы обработать его вручную, воспользуйтесь программой MS Excel или MATLAB; это позволит избежать ошибок в процессе вычисления.

Реклама

Источники

Об этой статье

Эту страницу просматривали 144 126 раз.

Была ли эта статья полезной?

Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.

Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).

Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.

На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.

Выборка. Объем. Размах

Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней

расходы за шесть дней статистика рисунок 1

Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6

n = 6

Элементы выборки обозначаются с помощью переменных с индексами икс 1 икс 2 икс n. Последний икс n элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.

расходы за шесть дней статистика рисунок 2

Обозначим элементы нашей выборки через переменные икс 1 икс 2 икс n

Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.

Размахом выборки называют разницу между самым большим и маленьким элементом выборки.

В нашем случае, самым большим элементом выборки является элемент 250, а самым маленьким — элемент 150. Разница между ними равна 100

x max и xmin 250 и 150

размах равен 100 R 100


Среднее арифметическое

Понятие среднего значения часто используется в повседневной жизни.

Примеры:

  • средняя зарплата жителей страны;
  • средний балл учащихся;
  • средняя скорость движения;
  • средняя производительность труда.

Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.

Среднее арифметическое — это результат деления суммы элементов выборки на их количество.

формула нахождения среднего значения

Вернемся к нашему примеру

расходы за шесть дней статистика рисунок 2

Узнаем сколько в среднем мы тратили в каждом из шести дней:

расходы за шесть дней статистика рисунок 3


Средняя скорость движения

При изучении задач на движение мы определяли скорость движения следующим образом: делили пройденное расстояние на время. Но тогда подразумевалось, что тело движется с постоянной скоростью, которая не менялась на протяжении всего пути.

В реальности, это происходит довольно редко или не происходит совсем. Тело, как правило, движется с различной скоростью.

Когда мы ездим на автомобиле или велосипеде, наша скорость часто меняется. Когда впереди нас помехи, нам приходиться сбавлять скорость. Когда же трасса свободна, мы ускоряемся. При этом за время нашего ускорения скорость изменяется несколько раз.

Речь идет о средней скорости движения. Чтобы её определить нужно сложить скорости движения, которые были в каждом часе/минуте/секунде и результат разделить на время движения.

Задача 1. Автомобиль первые 3 часа двигался со скоростью 66,2 км/ч, а следующие 2 часа — со скоростью 78,4 км/ч. С какой средней скоростью он ехал?

средняя скорость движения рисунок 1

Сложим скорости, которые были у автомобиля в каждом часе и разделим на время движения (5ч)

нахождение средней скорости движения задача 1

Значит автомобиль ехал со средней скоростью 71,08 км/ч.

Определять среднюю скорость можно и по другому — сначала найти расстояния, пройденные с одной скоростью, затем сложить эти расстояния и результат разделить на время. На рисунке видно, что первые три часа скорость у автомобиля не менялась. Тогда можно найти расстояние, пройденное за три часа:

66,2 × 3 = 198,6 км.

Аналогично можно определить расстояние, которое было пройдено со скоростью 78,4 км/ч. В задаче сказано, что с такой скоростью автомобиль двигался 2 часа:

78,4 × 2 = 156,8 км.

Сложим эти расстояния и результат разделим на 5

нахождение средней скорости движения задача 1 второй способ


Задача 2. Велосипедист за первый час проехал 12,6 км, а в следующие 2 часа он ехал со скоростью 13,5 км/ч. Определить среднюю скорость велосипедиста.

нахождение средней скорости движения задача 2

Скорость велосипедиста в первый час составляла 12,6 км/ч. Во второй и третий час он ехал со скоростью 13,5. Определим среднюю скорость движения велосипедиста:

нахождение средней скорости движения задача 2 рисунок 2


Мода и медиана

Модой называют элемент, который встречается в выборке чаще других.

Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров

таблица для определения моды рисунок 1

Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.

Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат

выборка люди и смартфоны

Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.

Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.


Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:

таблица для определения медианы рисунок 1

Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:

таблица для определения медианы рисунок 2

Выпишем рост спортсменов отдельно:

180, 182, 183, 184, 185, 188, 190

В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.

Медианой упорядоченной выборки называют элемент, располагающийся посередине.

Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.

В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану

рост семерых спортсменов рисунок 1

Но возможны случаи, когда количество элементов выборки чётно.

К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:

таблица для определения медианы рисунок 3

Построим этих шестерых спортсменов по росту:

таблица для определения медианы рисунок 4

Выпишем рост спортсменов отдельно:

180, 182, 184, 186, 188, 190

В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.

В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.

Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186

рост шестерых спортсменов рисунок 2

Найдем среднее арифметическое элементов 184 и 186

средняя арифметическое чисел 184 и 186

Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.

Поэтому более точное определение медианы зависит от количества элементов в выборке.

Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.

Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.

Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190

среднее ариф для 180 182 184 186 188 190

Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:

Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1

Определим среднее арифметическое для данной выборки — получим значение 2,2

среднее ариф для 011121235450161

По данному значению можно сказать, что в среднем у спортсменов 2,2 очка

Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:

0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6

В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.


Частота

Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.

Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.

таблица для определения частоты рисунок 1

По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.

Количество человек, повторяющих одно и то же число подтягиваний в данном случае являются частотой. Поэтому вторую строку таблицы переименуем в название «частота»:

таблица для определения частоты рисунок 2

Такие таблицы называют таблицами частот.

Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.

Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:

4 + 5 + 10 + 8 + 6 + 3 = 36


Относительная частота

Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.

Относительная частота равна отношению частоты на общее число элементов выборки.

Вернемся к нашей таблице:

таблица для определения частоты рисунок 2

Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее. Давайте заполним таблицу с помощью таких отношений:

таблица для определения частоты рисунок 3

Выполним деление в этих дробях:

таблица для определения частоты рисунок 4

Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:

таблица для определения частоты рисунок 5

Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.


Понравился урок?
Вступай в нашу новую группу Вконтакте и начни получать уведомления о новых уроках

Возникло желание поддержать проект?
Используй кнопку ниже



Download Article

Preparing, calculating, and reporting your data


Download Article

Absolute frequency is a simple concept to grasp: it refers to the number of times a particular value appears in a specific data set (a collection of objects or values). However, relative frequency can be a little trickier. It refers to the proportion of times a particular value appears in a specific data set. In other words, relative frequency is, in essence, how many times a given event occurs divided by the total number of outcomes. If you organize your data, calculating and presenting relative frequency can become a simple task.

  1. Image titled Calculate Relative Frequency Step 1

    1

    Collect your data. Unless you are just completing a math homework assignment, calculating relative frequency generally implies that you have some form of data. Conduct your experiment or study and collect the data. Decide how precisely you wish to report your results.[1]

    • For example, suppose you are collecting data on the ages of people who attend a particular movie. You could decide to collect and report the exact age of everyone who attends. But this is likely to give you 60 or 70 different results, being every number from about 10 through 70 or 80. You may instead wish to collect data in groups, like “Under 20,” “20-29,” “30-39,” “40-49,” “50-59,” and “60 plus.” This would be a more manageable set of six data groups.
    • As another example, a doctor might collect body temperatures of patients on a given day. In this case, just collecting whole numbers, like 97, 98, 99, might not be precise enough. It might be necessary to report data in decimals in this case.
  2. Image titled Calculate Relative Frequency Step 2

    2

    Sort the data. After you complete your study or experiment, you are likely to have a collection of data values that could look like 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. In this form, the data appear almost meaningless and difficult to use. It is more helpful to sort the data in order from lowest to highest. This would result in the list 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.

    • When you are sorting and rewriting your collection of data, be careful to include every point correctly. Count the data set to make sure you do not leave off any values.

    Advertisement

  3. Image titled Calculate Relative Frequency Step 3

    3

    Use a data table. You can summarize the results of your data collection by creating a simple data frequency table. This is a chart with three columns that you will use for your relative frequency calculations. Label the columns as follows:[2]

    • x. This column will be filled with each value that appears in your data set. Do not repeat items. For example, if the value 4 appears several times in the list, just put 4 under the x column once.
    • n, n(x) or fr(x). In statistics, the variable n is conventionally used to represent the count of a particular value. You may also write n(x), which is read as “n of x,” and means the count of each x-value. A final alternative is fr(x), which means the “frequency of x.” In this column, you will put the number of times that the value appears. For example, if the number 4 appears three times, you will place a 3 next to the number 4.
    • Relative Frequency or P(x). This final column is where you will record the relative frequency of each data item or grouping. The label P(x), which is read “P of x,” could mean the probability of x or the percentage of x. The calculation of relative frequency appears below. This column will be used after you complete that calculation for each value of x.
  4. Advertisement

  1. Image titled Calculate Relative Frequency Step 4

    1

    Count your full data set. Relative frequency is a measure of the number of times a particular value results, as a fraction of the full set. In order to calculate relative frequency, you need to know how many data points you have in your full data set. The will become the denominator in the fraction that you use for calculating.[3]

    • In the sample data set provided above, counting each item results in 16 total data points.
  2. Image titled Calculate Relative Frequency Step 5

    2

    Count each result. You need to determine the number of times that each data point appears in your results. You may want to calculate the relative frequency of one particular item, or you may be summarizing the overall data for the full data set.[4]

    • For example, in the data set provided above, consider the value 4. This value appears three times in the list.
  3. Image titled Calculate Relative Frequency Step 6

    3

    Divide each result by the total size of the set. This is the final calculation to determine the relative frequency of each item. You can set it up as a fraction or use a calculator or spreadsheet to perform the division.[5]

  4. Advertisement

  1. Image titled Calculate Relative Frequency Step 7

    1

    Present your results in a frequency table. The frequency table that you began above can be used to present the results in a format that is easy to review. As you perform each of the calculations, fill in the results in the corresponding places in the table. It is common to round your answers to two decimal places, although you will need to decide this for yourself based on the needs of your study. Because of rounding the end result may total something close to , but not exactly 1.0.[6]

    • For example, using the data set above, the relative frequency table would appear as follows:
    • x : n(x) : P(x)
    • 1 : 3 : 0.19
    • 2 : 1 : 0.06
    • 3 : 2 : 0.13
    • 4 : 3 : 0.19
    • 5 : 4 : 0.25
    • 6 : 2 : 0.13
    • 7 : 1 : 0.06
    • total : 16 : 1.01
  2. Image titled Calculate Relative Frequency Step 8

    2

    Report items that do not appear. It may be just as meaningful to report items whose frequency is 0 as to report those items that do appear in your data set. Look at the kind of data you are collecting, and if you notice any gaps in your sorted data, you may need to report them as 0s.

    • For example, the sample data set you have been working with includes all values from 1 to 7. But suppose that the number 3 never appeared. That could be important, and you would report the relative frequency of the value 3 as 0.
  3. Image titled Calculate Relative Frequency Step 9

    3

    Show your results as percentages. You may wish to turn your decimal results into percentages. This is a common practice, as relative frequency is often used as a predictor of the percentage of times that some value will occur. To convert a decimal number to a percentage, simply shift the decimal point two spaces to the right, and add a percent symbol.[7]

    • For example, the decimal result of 0.13 is equal to 13%.
    • The decimal result of 0.06 is equal to 6%. (Don’t just skip over the 0.)
  4. Advertisement

Add New Question

  • Question

    What is frequency of the event?

    Donagan

    It’s a measurement of how often the event occurs in a given time period.

  • Question

    How can you calculate frequency from relative frequency?

    Community Answer

    The word “frequency” alone is not very clear. In statistics, there are absolute frequency (the number of times a data point appears), relative frequency (usually presented as a percentage), or cumulative frequency. Cumulative frequency begins at 0 and adds up the frequencies as you move through your list. If you are just asked for “frequency,” from the relative frequency, it probably means the absolute frequency. Take your relative frequency, and multiply it by the total number of items in the full data set, and you will have the absolute frequency.

Ask a Question

200 characters left

Include your email address to get a message when this question is answered.

Submit

Advertisement

  • Physically speaking, the relative frequency tells you the presence or occurrence of a particular event in a set of events.

  • If you add up the relative frequencies of all items in a data set, you should get a sum of 1. If you round off your values, the sum may not be exactly 1.0.

  • If your data set is too large for simple counting, you may need to use a software package like MS-Excel or MATLAB to avoid mistakes.

Thanks for submitting a tip for review!

Advertisement

References

About This Article

Article SummaryX

To stop face sweating, try applying an astringent containing tannic acid, like witch hazel, to your face twice a day using a cotton ball. Additionally, apply an antiperspirant spray to your scalp, temples, and upper forehead to temporarily block your sweat glands. Alternatively, try using a dry shampoo to manage scalp sweating by holding it 8 inches from your head, then spraying it in 2 inch sections of your hair at a time. After that, massage the dry shampoo into your scalp for even distribution. For more tips, like how to show your results as percentages, read on!

Did this summary help you?

Thanks to all authors for creating a page that has been read 102,501 times.

Did this article help you?

Относительная частота и статистическая вероятность. Основные формулы и решения типовых задач
Относительная частота (частость) события А определяется равенством

W(A)=frac{m}{n},; ; ; ; (5)

где n – общее число проведенных испытаний; m – число испытаний, в которых событие А наступило (иначе – частота события А).
При статистическом определении за вероятность события принимают его относительную частоту, найденную по результатам большого числа испытаний.
Задача №1. При определении всхожести партии семян взяли пробу из 1000 единиц. Из отобранных семян не взошло 90. Какова относительная частота появления всхожего семени?
Решение. Обозначим событие: А – отобрано всхожее семя. Найдем относительную частоту события А, применив формулу (5). Общее число проведенных испытаний n = 1000. Число испытаний, в которых событие А наступило, равно m = 1000 – 90 = 910.
Относительная частота события А равна W(A)=frac{m}{n}=frac{910}{1000}=0,91.

Задача №2. Для проведения исследований на некотором поле взяли случайную выборку из 200 колосьев пшеницы. Относительная частота (частость) колосьев, имеющих по 12 колосков в колосе, оказалась равной 0,123, а по 18 колосков – 0,05. Найти для этой выборки частоты колосьев, имущих по 12 и по 18 колосков.
Решение. Рассмотрим события: A – взят колос, имеющий 12 колосков; В – взят колос, имеющий 18 колосков.
Найдем частоты m_{1} и m_{2} событий А и В применив формулу (5).
Обозначим через W_{1}(A)=frac{m_{1}}{n} относительную частоту события A, а через W_{2}(B)=frac{m_{2}}{n} относительную частоту события В. Так как число проведенных испытаний n = 200, то m_{1}=W_{1}(A)cdot n=0,125cdot 200=25,; m_{2}=W_{2}(B)cdot n=0,05cdot 200=10.

Задача №3. Многолетними наблюдениями установлено, что в некоторой области ежегодно в среднем в тридцати хозяйствах из каждых ста среднегодовой удой молока от одной коровы составляет 4 100 – 4 300 кг. Какова вероятность того, что в текущем году в одном из хозяйств этой области, отобранном случайным образом, будет получен такой среднегодовой удой?
Решение. Обозначим событие: А – в текущем году в хозяйстве области, отобранном случайным образом, среднегодовой удой молока от одной коровы составит 4 100 – 4 300 кг.
Вероятность события А найдем, воспользовавшись ее статистическим определением.
Располагая статистическими данными, найдем, что относительная частота хозяйств области, в которых ежегодно имеют указанный средне-годовой удой молока от одной коровы, равна 0,3. Так как эти данные получены в результате проведения большого числа наблюдений, выполняемых в течение многих лет, то можно принять, что вероятность события А равна Р(А) = 0,3.

эмпирическая
функция распределения

Пусть исследуется произвольная случайная
величина
и
относительно этой случайной величины
производится ряд независимых опытов
(испытаний) при наличии определённого
комплекса условий. Далее, пустьиз
генеральной совокупности извлечена
выборка, причем значениенаблюдалось

раз,
наблюдалосьраз, и так далее
наблюдалосьраз, при этом натуральное числои

,

выражает объём выборки,
значенияназываютвариантами
с.в
..Вся совокупность
значений с.в.представляет
собой первичный статистический материал,
который подлежит дальнейшей обработке,
сначала подлежатьупорядочению.
Операцию по упорядочению значений
случайной величины (признака) по не
убыванию называют «ранжированием»
статистических данных. Полученная таким
способом последовательность значенийслучайной
величины,
где;,называетсявариационным рядом.

Числа
,
показывающие, сколько раз встречаются
варианты (числа)в ряде наблюдений, называютсячастотами.
А числаравное отношениек объёму выборки,
называютсяотносительными частотами,
т.е.

(1)

Пе­речень вариантов
и соответствующие им частость
или относи­тельных
частот
называют
статическим распределением
выборки или статическим рядом
.

Статистическое распределение
записывается в виде таблицы, где в первой
строке пишут численные значения
вариантов, а вторая заполняется их
соответствующими частотами.
Из

этой таблицы затем составляют
новую таблицу с указанием частотностей
(относительных

частот)
,
где должен выполняться «контроль»

Пример
2.
Задано распределение
частот выборки объема
,

.

Эта таблица означает, что
принимается
три раза,принимается 10 раз ипринимается 7 раз. В итоге:.

Написать таблицу распределение
относительных частот.

Решение.
Найдем относительные частоты, для че­го
разделим частоты на объем выборки:

.

Теперь, составим таблицу распределения
относительных частот:

.

Контроль:

Пример 3. В
результате тестирования группы из 10
человек для приёма на работу претенденты
набрали баллы:
Составить

а) вариационный ряд;

б) статический ряд;

в) таблицу частот и относительных
частот.

Решение. а)
Упорядочив статические данные, получим
вариационный ряд:

;

б) Подсчитав частоту
и относительную частотность
вариантов:
получим статическое распределение
выборки (так называемый дискретный
ряд).

0

1

2

3

4

5

1

2

1

1

2

3

где
.
Контроль.

Построим таблицу относительную частоту

0

1

2

3

4

5

где
.
Контроль.

Статистическое распределение выборки
является оценкой неизвестного
распределения.

По теореме Бернулли, относительные
частоты
сходятся прик соответствующим вероятностям,т.е..
Поэтому, при больших значенияхстатическое распределение мало отличается
от истинного распределения.

В случаях, когда количество значений
признака (с.в.)
достаточно велико или когда случайная
величинаявляется непрерывной (т.е. её значение
заполняет некоторый отрезок числовой
прямой),составляют интервальный
статистический ряд.

В первую очередь образуют частичные
промежутки,
которые берут обычно с одинаковыми
длинами, равными.

Интервалы

Частота

Частость

Эта таблица означает, что весь диапазон
изменения величиныразбит на интервалы

(границами
го
интервала являются,и);
числоесть частота попадания вй
интервал,,
гдеколичество
чисел в исходном ряде (выборке),
приходящихся в
й интервал. На практике число интервалов
выбирается обычно в пределах одного-двух
десятков. Также следует отметить, что
в общем случае длины интервалов не
обязаны быть одинаковыми.

Для определения величины интервала
существуют разные подходы, в качестве
одного из таких способов разбиения,
может быть использована формула
Стерджесса:

где
выражает
разность между наибольшим и наименьшим
значениями признака,

числа интервалов
;.
За начало первого интервала рекомендуется
брать величину,
и если конец последнего промежутка
входит во множестве с.в.,
то оно также включается в число элементов,
входящих в последний промежуток. После
завершения «разбиения» первую строку
таблицы статического распределения
заполняют полученными частичными
промежутками. Во второй строчке
статистического ряда вписывают числа
количество наблюдений, попавших в каждый
интервал, а затем составляют вторую
таблицу относительных частот по выше
указанному принципу, где мы для удобства
объединили обе таблицы.

Заметим, что в теории вероятностей под
распределением понимают соответствие
между возможными значениями случайной
величины и их вероятностями, а в
математичес­кой статистике —
соответствие между наблюдаемыми
ва­риантами и их частотами, иличастость
(относительные частоты).

Пример 4. Измерили рост (с некоторой
точностью скажем до 1 см.) 30 наудачу
отобранных студентов. Результаты
измерения показали:

Построить интервальный статистический
ряд.

Решение.Сначала упорядочим полученные
данные.

Следует, что
рост
студентов является непрерывной с.в. При
более точном измерении роста значения
с.в.обычно
не повторяется и может отличиться друг
от друга на несколько миллиметров.
Вероятность наличия на Земле двух
человека с одинаковым ростом, например,

метров, равна нулю.

Отсюда следует, что
;
в соответствии с формулой Стерджесса,
при,
находим длину частичного интервала
разбиения:

Если примем за
,
тогдаВсе исходные данные разбиваем наинтервалов (при):

Подсчитав общее число студентов
,
попавших в каждый из полученных
промежутков, получим интервальный
статистический ряд:

Рост

[150-156)

[156-162)

[162-168)

[168-174)

[174-180)

[180-186)

Частота

4

5

6

7

5

3

Частость

0,13

0,17

0,20

0,23

0,17

0,10

Одним из способов статистической
обработки вариационного ряда является
построение

эмпирической функции распределения.

Пусть известно статистическое
распределение частот количественного
признака

число наблюдений, при которых наблюдалось
значе­ние признака,
а
общее
число наблюдений (объем выборки).

Эмпирической (статистической) функцией
распределения
называется функция,определяющая для каждого значениячастость события:

(2)
.

В отличие от эмпирической функции
распределения выборки, интегральную
функцию
распределения ге­неральной совокупности
называюттеоретической функ­цией
распределения.
Различие
между эмпирической и тео­ретической
функциями состоит в том, что теоретическая
функция

(3)

– определяет вероятность
события,
а эмпирическая функция
определяет
относительную частоту этого же события.

Очевидно, что функция
удовлетворяет
тем же условиям, что и истинная функция(см.Т.3).Другими словами,
числа
и мало отличаются одно от
другого. Уже отсюда следует целесообразность
исполь­зования эмпирической функции
распределения выборки для приближенного
представления теоретической (инте­гральной)
функции

-распределения генеральной
совокуп­ности. Такое заключение
подтверждается и тем, что
об­ладает всеми
свойствами .
Действительно, из
опреде­ления функции вытекают следующие ее
свойства:

1. Значения эмпирической функции
принадлежат от­резку [0,1];

2.
неубывающая функция;

3. Если
наименьшая
варианта, то
при
;
и если

наибольшая варианта, то при
,.

На основании теорем ЗБЧ при увеличении
числа
наблюдений (опытов) относительная
частота событияприближается к истинной вероятности
этого события.

Эмпирическая функция распределения
является
как бы «оценкой» вероятности события,
т.е. оценкой теоретической функции
распределенияс.в..

Таким образом, можно заключить, что
имеет место утверждение,

Пусть
является теоретическая функция
распределения случайной величины,
аеё эмпирической функцией распределения.
Тогда для любогосправедливо предельное соотношение

(4)

Пример 5.В условиях примера 3, и
используя полученные результаты,
построим эмпирическую функцию.

Решение. В нашем случае по условию.
В целях наглядности решения примера
приведём ещё раз полученную таблицу
относительных частот

0

1

2

3

4

5

где
.
Контроль.

Поэтому
при(наблюдений меньшеотсутствует);при(здесь
по таблице).при(здесь)
и т.д. Таким образом, получаем

График эмпирической функции распределения
имеет вид: (Рис. 72.)

Рисунок 72 из Письменного

Соседние файлы в папке Теория вероятностей от исмоилова

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

    06.02.20162.36 Mб71~WRL0002.tmp

  • #

    06.02.20161.87 Mб67~WRL0005.tmp

Добавить комментарий