В настоящем параграфе под данными мы будем понимать набор из пар чисел:
 |
(40) |
причем пара
представляет собой исход единичного наблюдения.
Роль чисел и в паре является различной и состоит
в следующем. Предполагается, что экспериментатор может абсолютно точно задавать
во время опыта значения и затем измерять, допуская при этом случайную
ошибку, значение . Например, -- температура, выбираемая
в процессе эксперимента над образцом материала, -- длина образца
при соответствующей температуре. Число принято называть фактором,
а число -- откликом. Экспериментатор предполагает, что
между величинами и существует функциональная зависимость вида
где известные функции, а
-- неизвестные
параметры. Предполагая, что ошибки, связанные с измерением отклика, независимы
и имеют распределение
, получим следующую модель
Она называется регрессионной моделью. Задача
состоит в том, чтобы оценить неизвестные величины
по данным наблюдений (40).
Для решения этой задачи эффективным оказывается подход, применяемый в предыдущих
параграфах: хорошей оценкой неизвестных параметров является та, которая ``минимизирует
сумму квадратов'':
Много дополнительных сведений о свойствах оценок наименьших квадратов в модели
регрессионного анализа, о проверке предпосылок к применению этой модели, а также
о проверке ее адекватности, можно почерпнуть из книги [13].
Иногда в качестве берут степенные функции:
Таким образом, речь идет о том, чтобы приблизить неизвестную функциональную
зависимость от полиномом вида
. В этом случае говорят о задаче сглаживания наблюдений
при помощи полинома. Более подробно об этой важной задаче,
в том числе о проблеме выбора степени полинома, можно прочитать в книге [12].
|  |