Метод наименьших квадратов

Grandars Математика Алгебра

Классическая регрессионная модель и метод наименьших квадратов

Метод наименьших квадратов является одним из наиболее распространенных и наиболее разработанных вследствие своей простоты и эффективности методов оценки параметров линейных эконометрических моделей. Вместе с тем, при его применении следует соблюдать определенную осторожность, поскольку построенные с его использованием модели могут не удовлетворять целому ряду требований к качеству их параметров и, вследствие этого, недостаточно “хорошо” отображать закономерности развития процесса \(y_t\).

Рассмотрим процедуру оценки параметров линейной эконометрической модели с помощью метода наименьших квадратов более подробно. Такая модель в общем виде может быть представлена уравнением (1.2):

yt = a0 + a1 х1t +...+ an хnt + εt .

Исходными данными при оценке параметров a0 , a1 ,..., an является вектор значений зависимой переменной y = (y1 , y2 , ... , yT )' и матрица значений независимых переменных

в которой первый столбец, состоящий из единиц, соответствует коэффициенту модели \(a_0\).

Название свое метод наименьших квадратов получил, исходя из основного принципа, которому должны удовлетворять полученные на его основе оценки параметров: сумма квадратов ошибки модели должна быть минимальной.

Примеры решения задач методом наименьших квадратов

Пример 2.1. Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена в табл. 2.1.

Руководство предприятия хотело бы знать, как зависит размер годового товарооборота от торговой площади магазина.

Таблица 2.1

Номер магазина

Годовой товарооборот, млн руб.

Торговая площадь, тыс. м2

1

19,76

0,24

2

38,09

0,31

3

40,95

0,55

4

41,08

0,48

5

56,29

0,78

6

68,51

0,98

7

75,01

0,94

8

89,05

1,21

9

91,13

1,29

10

91,26

1,12

11

99,84

1,29

12

108,55

1,49

Решение методом наименьших квадратов. Обозначим \(y_t\) – годовой товарооборот \(t\)-го магазина, млн руб.; \(x_{1t}\) – торговая площадь \(t\)-го магазина, тыс. м2.

Рис.2.1. Диаграмма рассеяния для примера 2.1

Для определения формы функциональной зависимости между переменными \(y_t\) и \(x_{1t}\) построим диаграмму рассеяния (рис. 2.1).

На основании диаграммы рассеяния можно сделать вывод о позитивной зависимости годового товарооборота от торговой площади (т.е. у будет расти с ростом \(x_1\)). Наиболее подходящая форма функциональной связи – линейная.

Информация для проведения дальнейших расчетов представлена в табл. 2.2. С помощью метода наименьших квадратов оценим параметры линейной однофакторной эконометрической модели

Таблица 2.2

t

yt

x1t

yt2

x1t 2

x1t yt

1

2

3

4

5

6

1

19,76

0,24

390,4576

0,0576

4,7424

2

38,09

0,31

1450,8481

0,0961

11,8079

3

40,95

0,55

1676,9025

0,3025

22,5225

4

41,08

0,48

1687,5664

0,2304

19,7184

5

56,29

0,78

3168,5641

0,6084

43,9062

6

68,51

0,98

4693,6201

0,9604

67,1398

7

75,01

0,94

5626,5001

0,8836

70,5094

8

89,05

1,21

7929,9025

1,4641

107,7505

9

91,13

1,29

8304,6769

1,6641

117,5577

10

91,26

1,12

8328,3876

1,2544

102,2112

11

99,84

1,29

9968,0256

1,6641

128,7936

12

108,55

1,49

11783,1025

2,2201

161,7395

S

819,52

10,68

65008,554

11,4058

858,3991

Среднее

68,29

0,89

Таким образом,

Cледовательно, при увеличении торговой площади на 1 тыс. м2 при прочих равных условиях среднегодовой товарооборот увеличивается на 67,8871 млн руб.

Пример 2.2. Руководство предприятия заметило, что годовой товарооборот зависит не только от торговой площади магазина (см. пример 2.1), но и от среднего числа посетителей. Соответствующая информация представлена в табл. 2.3.

Таблица 2.3

Номер магазина

Среднее число посетителей
в день, тыс. чел.

1

8,25

2

10,24

3

9,31

4

11,01

5

8,54

6

7,51

7

12,36

8

10,81

9

9,89

10

13,72

11

12,27

12

13,92

Решение. Обозначим \(x_{2t}\) – среднее число посетителей \(t\)-го магазина в день, тыс. чел.

Для определения формы функциональной зависимости между переменными \(y\) и \(x_2\) построим диаграмму рассеяния (рис. 2.2).

На основании диаграммы рассеяния можно сделать вывод о позитивной зависимости годового товарооборота от среднего числа посетителей в день (т.е. у будет расти с ростом \(x_2\)). Форма функциональной зависимости – линейная.

Рис. 2.2. Диаграмма рассеяния для примера 2.2

Таблица 2.4

t

x2t

x2t 2

yt x2t

x1t x2t

1

2

3

4

5

1

8,25

68,0625

163,02

1,98

2

10,24

104,8575

390,0416

3,1744

3

9,31

86,6761

381,2445

5,1205

4

11,01

121,2201

452,2908

5,2848

5

8,54

72,9316

480,7166

6,6612

6

7,51

56,4001

514,5101

7,3598

7

12,36

152,7696

927,1236

11,6184

8

10,81

116,8561

962,6305

13,0801

9

9,89

97,8121

901,2757

12,7581

10

13,72

188,2384

1252,0872

15,3664

11

12,27

150,5529

1225,0368

15,8283

12

13,92

193,7664

1511,016

20,7408

S

127,83

1410,44

9160,9934

118,9728

Cреднее

10,65

В целом необходимо определить параметры двухфакторной эконометрической модели

уt = a0 + a1 х1t + a2 х2t + εt

Информация, требующаяся для дальнейших расчетов, представлена в табл. 2.4.

Оценим параметры линейной двухфакторной эконометрической модели с помощью метода наименьших квадратов.

Таким образом,

Оценка коэффициента =61,6583 показывает, что при прочих равных условиях с увеличением торговой площади на 1 тыс. м2 годовой товарооборот увеличится в среднем на 61,6583 млн руб.

Оценка коэффициента = 2,2748 показывает, что при прочих равных условиях с увеличением среднего числа посетителей на 1 тыс. чел. в день годовой товарооборот увеличится в среднем на 2,2748 млн руб.

Пример 2.3. Используя информацию, представленную в табл. 2.2 и 2.4, оценить параметр однофакторной эконометрической модели

где – центрированное значение годового товарооборота \(t\)-го магазина, млн руб.; – центрированное значение среднедневного числа посетителей t-го магазина, тыс. чел. (см. примеры 2.1-2.2).

Решение. Дополнительная информация, необходимая для расчетов, представлена в табл. 2.5.

Таблица 2.5

\(t\)

1

2

3

4

5

1

-48,53

-2,40

5,7720

116,6013

2

-30,20

-0,41

0,1702

12,4589

3

-27,34

-1,34

1,8023

36,7084

4

-27,21

0,36

0,1278

-9,7288

5

-12,00

-2,11

4,4627

25,3570

6

0,22

-3,14

9,8753

-0,6809

7

6,72

1,71

2,9156

11,4687

8

20,76

0,16

0,0348

3,2992

9

22,84

-0,76

0,5814

-17,413

10

22,97

3,07

9,4096

70,4503

11

31,55

1,62

2,6163

51,0267

12

40,26

3,27

10,6766

131,5387

Cумма

48,4344

431,0566

Используя формулу (2.35), получим

Таким образом,

0.052 сек.