6.1 Понятие о выборкеОтправной точкой любого статистического анализа являются данные, полученные экспериментатором в результате опыта. Допустим, что опыт состоял из повторных измерений некоторой неизвестной величины и в результате получены значения . Эти значения естественно считать реализацией набора из независимых одинаково распределенных случайных величин с неизвестной функцией распределения . Вектор данных Часто встречается ситуация, когда экспериментатор имеет основания предполагать, что неизвестное распределение принадлежит некоторому семейству распределений , зависящему от параметра . В этом случае проблема статистического анализа сводится к получению информации об этом неизвестном параметре. Проиллюстрируем все вышесказанное следующими примерами.
Пример 6.1
Неизвестная величина измеряется некоторым несовершенным прибором, прибавляющим к случайную ошибку, распределенную по нормальному закону с нулевым средним и известной дисперсией . Если измерения проводятся раз, то в итоге мы имеем независимую выборку из распределения, принадлежащему семейству . Об этой статистической модели принято говорить как о независимой выборке из нормального распределения с известной дисперсией.
Пример 6.2
Если в ситуации предыдущего примера документация прибора ничего не сообщает о дисперсии совершаемой им ошибки, то мы имеем дело с независимой выборкой из распределения, принадлежащему семейству , . То есть, в такой постановке неизвестный параметр двумерен.
Пример 6.3
Если исследователь не уверен в том, что ошибка измерительного прибора является нормальной случайной величиной, он вправе поставить перед собой следующий вопрос: как, основываясь на полученной им независимой выборке из неизвестного распределения с функцией распределения , проверить гипотезу о принадлежности классу нормальных распределений.
Пример 6.4
Большим источником статистических данных является аналитическая химия. Рассмотрим числовые данные, взятые из книги [5, с. 41]: для контроля качества в 40 пробах стали GS50 определялось содержание углерода (%С) и прочность на разрыв (Н/мм). Данные оформлены в виде таблицы чисел:
Таким образом, мы имеем дело с независимой выборкой :
имеющей объем 40 и составленной из данных измерений содержания углерода, и с независимой выборкой :
составленную из измерений прочности на разрыв. В дальнейшем для иллюстрации вводимых понятий мы будем многократно возвращаться к этому числовому примеру.
| ||||||||||
А.Д. Манита, 2001-2011 |