Классическая регрессионная модель и метод наименьших квадратов
Метод наименьших квадратов является одним из наиболее распространенных и наиболее разработанных вследствие своей простоты и эффективности методов оценки параметров линейных эконометрических моделей. Вместе с тем, при его применении следует соблюдать определенную осторожность, поскольку построенные с его использованием модели могут не удовлетворять целому ряду требований к качеству их параметров и, вследствие этого, недостаточно “хорошо” отображать закономерности развития процесса \(y_t\).
Рассмотрим процедуру оценки параметров линейной эконометрической модели с помощью метода наименьших квадратов более подробно. Такая модель в общем виде может быть представлена уравнением (1.2):
yt = a0 + a1 х1t +...+ an хnt + εt .
Исходными данными при оценке параметров a0 , a1 ,..., an является вектор значений зависимой переменной y = (y1 , y2 , ... , yT )' и матрица значений независимых переменных
в которой первый столбец, состоящий из единиц, соответствует коэффициенту модели \(a_0\).
Название свое метод наименьших квадратов получил, исходя из основного принципа, которому должны удовлетворять полученные на его основе оценки параметров: сумма квадратов ошибки модели должна быть минимальной.
Примеры решения задач методом наименьших квадратов
Пример 2.1. Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена в табл. 2.1.
Руководство предприятия хотело бы знать, как зависит размер годового товарооборота от торговой площади магазина.
Таблица 2.1
Номер магазина |
Годовой товарооборот, млн руб. |
Торговая площадь, тыс. м2 |
1 |
19,76 |
0,24 |
2 |
38,09 |
0,31 |
3 |
40,95 |
0,55 |
4 |
41,08 |
0,48 |
5 |
56,29 |
0,78 |
6 |
68,51 |
0,98 |
7 |
75,01 |
0,94 |
8 |
89,05 |
1,21 |
9 |
91,13 |
1,29 |
10 |
91,26 |
1,12 |
11 |
99,84 |
1,29 |
12 |
108,55 |
1,49 |
Решение методом наименьших квадратов. Обозначим \(y_t\) – годовой товарооборот \(t\)-го магазина, млн руб.; \(x_{1t}\) – торговая площадь \(t\)-го магазина, тыс. м2.
Рис.2.1. Диаграмма рассеяния для примера 2.1
Для определения формы функциональной зависимости между переменными \(y_t\) и \(x_{1t}\) построим диаграмму рассеяния (рис. 2.1).
На основании диаграммы рассеяния можно сделать вывод о позитивной зависимости годового товарооборота от торговой площади (т.е. у будет расти с ростом \(x_1\)). Наиболее подходящая форма функциональной связи – линейная.
Информация для проведения дальнейших расчетов представлена в табл. 2.2. С помощью метода наименьших квадратов оценим параметры линейной однофакторной эконометрической модели
Таблица 2.2
t |
yt |
x1t |
yt2 |
x1t 2 |
x1t yt |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
19,76 |
0,24 |
390,4576 |
0,0576 |
4,7424 |
2 |
38,09 |
0,31 |
1450,8481 |
0,0961 |
11,8079 |
3 |
40,95 |
0,55 |
1676,9025 |
0,3025 |
22,5225 |
4 |
41,08 |
0,48 |
1687,5664 |
0,2304 |
19,7184 |
5 |
56,29 |
0,78 |
3168,5641 |
0,6084 |
43,9062 |
6 |
68,51 |
0,98 |
4693,6201 |
0,9604 |
67,1398 |
7 |
75,01 |
0,94 |
5626,5001 |
0,8836 |
70,5094 |
8 |
89,05 |
1,21 |
7929,9025 |
1,4641 |
107,7505 |
9 |
91,13 |
1,29 |
8304,6769 |
1,6641 |
117,5577 |
10 |
91,26 |
1,12 |
8328,3876 |
1,2544 |
102,2112 |
11 |
99,84 |
1,29 |
9968,0256 |
1,6641 |
128,7936 |
12 |
108,55 |
1,49 |
11783,1025 |
2,2201 |
161,7395 |
S |
819,52 |
10,68 |
65008,554 |
11,4058 |
858,3991 |
Среднее |
68,29 |
0,89 |
Таким образом,
Cледовательно, при увеличении торговой площади на 1 тыс. м2 при прочих равных условиях среднегодовой товарооборот увеличивается на 67,8871 млн руб.
Пример 2.2. Руководство предприятия заметило, что годовой товарооборот зависит не только от торговой площади магазина (см. пример 2.1), но и от среднего числа посетителей. Соответствующая информация представлена в табл. 2.3.
Таблица 2.3
Номер магазина |
Среднее число посетителей |
1 |
8,25 |
2 |
10,24 |
3 |
9,31 |
4 |
11,01 |
5 |
8,54 |
6 |
7,51 |
7 |
12,36 |
8 |
10,81 |
9 |
9,89 |
10 |
13,72 |
11 |
12,27 |
12 |
13,92 |
Решение. Обозначим \(x_{2t}\) – среднее число посетителей \(t\)-го магазина в день, тыс. чел.
Для определения формы функциональной зависимости между переменными \(y\) и \(x_2\) построим диаграмму рассеяния (рис. 2.2).
На основании диаграммы рассеяния можно сделать вывод о позитивной зависимости годового товарооборота от среднего числа посетителей в день (т.е. у будет расти с ростом \(x_2\)). Форма функциональной зависимости – линейная.
Рис. 2.2. Диаграмма рассеяния для примера 2.2
Таблица 2.4
t |
x2t |
x2t 2 |
yt x2t |
x1t x2t |
1 |
2 |
3 |
4 |
5 |
1 |
8,25 |
68,0625 |
163,02 |
1,98 |
2 |
10,24 |
104,8575 |
390,0416 |
3,1744 |
3 |
9,31 |
86,6761 |
381,2445 |
5,1205 |
4 |
11,01 |
121,2201 |
452,2908 |
5,2848 |
5 |
8,54 |
72,9316 |
480,7166 |
6,6612 |
6 |
7,51 |
56,4001 |
514,5101 |
7,3598 |
7 |
12,36 |
152,7696 |
927,1236 |
11,6184 |
8 |
10,81 |
116,8561 |
962,6305 |
13,0801 |
9 |
9,89 |
97,8121 |
901,2757 |
12,7581 |
10 |
13,72 |
188,2384 |
1252,0872 |
15,3664 |
11 |
12,27 |
150,5529 |
1225,0368 |
15,8283 |
12 |
13,92 |
193,7664 |
1511,016 |
20,7408 |
S |
127,83 |
1410,44 |
9160,9934 |
118,9728 |
Cреднее |
10,65 |
В целом необходимо определить параметры двухфакторной эконометрической модели
уt = a0 + a1 х1t + a2 х2t + εt
Информация, требующаяся для дальнейших расчетов, представлена в табл. 2.4.
Оценим параметры линейной двухфакторной эконометрической модели с помощью метода наименьших квадратов.
Таким образом,
Оценка коэффициента =61,6583 показывает, что при прочих равных условиях с увеличением торговой площади на 1 тыс. м2 годовой товарооборот увеличится в среднем на 61,6583 млн руб.
Оценка коэффициента = 2,2748 показывает, что при прочих равных условиях с увеличением среднего числа посетителей на 1 тыс. чел. в день годовой товарооборот увеличится в среднем на 2,2748 млн руб.
Пример 2.3. Используя информацию, представленную в табл. 2.2 и 2.4, оценить параметр однофакторной эконометрической модели
где – центрированное значение годового товарооборота \(t\)-го магазина, млн руб.; – центрированное значение среднедневного числа посетителей t-го магазина, тыс. чел. (см. примеры 2.1-2.2).
Решение. Дополнительная информация, необходимая для расчетов, представлена в табл. 2.5.
Таблица 2.5
\(t\) |
||||
1 |
2 |
3 |
4 |
5 |
1 |
-48,53 |
-2,40 |
5,7720 |
116,6013 |
2 |
-30,20 |
-0,41 |
0,1702 |
12,4589 |
3 |
-27,34 |
-1,34 |
1,8023 |
36,7084 |
4 |
-27,21 |
0,36 |
0,1278 |
-9,7288 |
5 |
-12,00 |
-2,11 |
4,4627 |
25,3570 |
6 |
0,22 |
-3,14 |
9,8753 |
-0,6809 |
7 |
6,72 |
1,71 |
2,9156 |
11,4687 |
8 |
20,76 |
0,16 |
0,0348 |
3,2992 |
9 |
22,84 |
-0,76 |
0,5814 |
-17,413 |
10 |
22,97 |
3,07 |
9,4096 |
70,4503 |
11 |
31,55 |
1,62 |
2,6163 |
51,0267 |
12 |
40,26 |
3,27 |
10,6766 |
131,5387 |
Cумма |
48,4344 |
431,0566 |
Используя формулу (2.35), получим
Таким образом,