1. Центральные тенденции
Теория:
В статистике исследуют различные совокупности данных — числовых значений случайных величин с учётом частот, с которыми они встречаются в совокупности.
Набор всех данных назовём генеральной совокупностью, а любую её часть — выборкой.
В статистических исследованиях выборку называют репрезентативной, если в ней присутствуют те и только те значения случайной величины, что и в генеральной совокупности, причём частоты имеющихся в ней данных находятся практически в тех же отношениях, что и в генеральной совокупности.
Совокупность данных иногда нужно оценить одним числом. Мерой центральной тенденции может являться среднее, мода или медиана.
Мода (обозначают Mo) — это значение случайной величины, имеющее наибольшую частоту в рассматриваемой выборке.
Пример:
мода выборки 7, 6, 2, 5, 6, 1 равна 6;
a выборка 2, 3, 8, 2, 8, 5 имеет две моды: Mo =2, Mo =8.
Медиана (обозначают Me) — это число (значение случайной величины), разделяющее упорядоченную выборку на две равные по количеству данных части.
Если в упорядоченной выборке нечётное количество данных, то медиана равна серединному из них. Если в упорядоченной выборке чётное количество данных, то медиана равна среднему арифметическому двух серединных чисел.
Пример:
1) 5, 9, 1, 4, 5, −2, 0; 2) 7, 4, 2, 3, 6, 1.
1. Расположим элементы выборки в порядке возрастания: −2, 0, 1, 4, 5, 5, 9. Количество данных нечётно. Слева и справа от числа 4 находятся по 3 элемента, т. е. 4 — серединное число выборки, поэтому Me =4.
2. Упорядочим элементы выборки: 1, 2, 3, 4, 6, 7.
Количество данных чётно. Серединные данные выборки: 3 и 4 — поэтому Me=3+42=3,5.
Среднее (или среднее арифметическое) выборки — это число, равное отношению суммы всех чисел выборки к их количеству.
Если рассматривается совокупность значений случайной величины X, то её среднее обозначают X¯¯¯.
Пример:
найти среднее выборки значений случайной величины X, распределение которых по частотам представлено в таблице:
X 2 3 4 8 10
M 1 2 3 1 1
X¯¯¯=2⋅1+3⋅2+4⋅3+8⋅1+10⋅11+2+3+1+1=388=4,75.
Одной из наиболее распространённых характеристик выборки значений случайной величины, чьё распределение по вероятностям известно, является так называемое математическое ожидание.
Пусть распределение по вероятностям P значений некоторой случайной величины X задано таблицей.
X X1 X2 … Xn−1 Xn
P P1 P2 … Pn−1 Pn
Тогда число E, где E=X1⋅P1+X2⋅P2+…+Xn−1⋅Pn−1+Xn⋅Pn, называют математическим ожиданием (или средним значением) случайной величины X.
Решить тест на сайте учи ру.