Математические основы изучения экономического риска

При анализе экономического риска рассматривают его качественную, количественную и правовую стороны. Для численного выражения риска используется определенный математический аппарат. Основными математическими понятиями, которые возникают при количественной оценке риска, являются: вероятность, случайная величина, математическое ожидание, дисперсия (вариация), коэффициент вариации, коэффициент корреляции, проценты, простейшие функции и их графики, матрица, производная. Эти понятия надо знать и глубоко понимать.

Фундаментальными понятиями в этом курсе и в статистическом анализе является понятие вероятности и случайной величины (переменной). Под термином случайная величина в теории вероятностей понимается не всякая переменная величина, которая принимает случайные, наперед неизвестные неопределенные значения.

Случайной переменной мы называем переменную, которая под воздействием случайных факторов может с определенными вероятностями принимать те или иные значения из некоторого множества чисел.

Случайная величина - это переменная, которой даже при фиксированных обстоятельствах мы не можем приписать определенное значение, но можем приписать несколько значений, которые она принимает с определенными вероятностями.

Под вероятностью некоторого события (например, события, состоящего в том, что случайная переменная приняла определенное значение) обычно понимается доля числа исходов, благоприятствующего данному событию в общем числе возможных равновероятных исходов.

Случайные величины обозначают буквами: X, Y,^ ,R, Ri x и т.д.

Основными характеристиками случайных величин являются следующие величины.

1. Математическое ожидание (среднее значение) случайной величины.

Математическое ожидание дискретной случайной величины X находится по формуле

M(X) = m = mx = ЕР х

где Xi - значения случайной величины;

Pi - вероятности, с которыми эти значения принимаются.

Математическое ожидание непрерывной случайной величины X находится по формуле

М(Х) = jxf (x)dx,

где f(x) - плотность распределения значений случайной величины.

2. Дисперсия (вариация) и среднеквадратическое отклонение случайной величины.

Дисперсия - это степень рассеянности (разброса) значений случайной величины вокруг своего среднего значения. Дисперсия и среднеквадратическое отклонение случайной величины находятся, соответственно, по формулам:

D(X) = V = М(Х - М(Х))2 = М(Х2) - (М(Х))2,

V = g2,g = gx=Vd(x),

D(X)= V=VXX,

D(X) = XPixf - (M(X))2,D(X) = jx2f(x)dx- (M(X))2.

3. Ковариация.

Ковариация - вспомогательная величина. Ковариация между случайными величинами X,Y обозначается cov(X,Y) или V .

XY

Ковариацией (корреляционным моментом) называется величина

VXY = KXY = M*X - M(X))(Y - M(Y))}

4. Коэффициент корреляции.

Коэффициентом корреляции называется величина

PXY=^(-i<PXY<i).

Если

p = 1 - полная прямая линейная корреляция,

р = -1 - полная обратная линейная корреляция,

р =0- XhY- некоррелированные случайные величины.

Оценка тесноты линейной связи производится по следующей таблице.

Таблица 1.1

Теснота связи

Значение рху

Прямая связь

Обратная связь

Слабая

0,1-0,3

(-0,3)-(-0,1)

Средняя

0,3 - 0,7

(- 0,7) - (- 0,3)

Тесная

0,7-1

(-!)-(-0,7)

В случае нелинейной зависимости между случайными величинами X и

Y коэффициент корреляции рху нельзя использовать для выявления тесноты связи. Его вычисление при нелинейной зависимости позволяет:

a) охарактеризовать степень приближения исследуемой корреляционной зависимости к функциональной;

b) сделать предварительную оценку тесноты корреляционной зависимости.

Заметим, что в большинстве практических задач измерение тесноты связи начинают с вычисления коэффициента корреляции.

Коэффициент корреляции - безразмерная величина. Если с „ростом" одной величины „растет" и другая, то р >0, если с „ростом" одной - дру-

гая величина „уменьшается", то р <0. Близкая к нулю величина коэффици-

ента корреляции говорит об отсутствии линейной связи между переменными, но не об отсутствии связи между ними вообще. Корреляционный момент

V , как и коэффициент корреляции, характеризирует степень линейной связи величин XhY. Коэффициент корреляции - это нормированный корреляционный момент. Ковариация сама по себе используется редко; она обычно фигурирует как промежуточный элемент расчета коэффициента корреляции. Геометрическая интерпретация коэффициента корреляции проиллюстрирована на рис. 1.1- рис. 1.6.

Положительная корреляция между X и Y

Отрицательная корреляция между X и Y

Полная прямая линейная корреляция между X и Y

Банки, риски, стратегии
Рис. 1.5. X и Y некоррелированные и независимы

Полная обратная линейная корреляция между X и Y независимы

Банки, риски, стратегии

Рис. 1.6.Х и Y некоррелированные,но зависимы

На практике оценки характеристик случайной величины находят по другим формулам:

5. Коэффициент детерминации.

Наряду с коэффициентом корреляции для исследования тесноты связи между величинами X и Y используют еще одну характеристику - коэффициент детерминации.

Коэффициент детерминации показывает, какая часть изменения Y вызванная изменением величины X. Остаток изменения Y вызван неучтенными факторами. Коэффициент детерминации - показатель адекватности регрессивной модели.

Коэффициент детерминации равен квадрату коэффициента корреляции

Х(У;-У)'

Х(у1-у):

где у; - теоретические значения случайной величины Y.

6. Уравнение линейной регрессии.

Уравнение линейной регрессии Y на X имеет вид

y-mY*x-m.

Пример 1.1. По выборочным данным для случайных величин X и Y (табл. 1.2) найти оценки математического ожидания, дисперсии, ковариации между X и Y. Найти уравнение линейной регрессии Y на X.

Таблица 1.2

X

4

2

3

1

3

4

2

5

4

2

Y

3

1

2

1

3

4

1

4

4

1

Аналогично вычисляем у = 2,4 и у =7,4. Теперь находим

а|=^(10,4-32) = 1,556, ax=VU556 = 1,247,

aY= —(7,4-2,42) = 1,822, aY =^1,822 = 1,350,

10 Vw=—(8,6- 3-2,4) = 1,556, рху=—Ь^— = 0,924.

Уравнение линейной регрессии Y на X:

y-2,4 = 0,924 -i^(x-3)=>

1,247

y=l,000x-0,601. Корреляционное поле и линия регрессии на нем выглядят так.

То, что коэффициент корреляции р = 0.924 ~ 1 означает, что между X и Y есть тесная линейная связь. Это видно и из рис. 1.7: точки (xi,yi) расположены вдоль прямой у = х - 0,6.

То, что коэффициент детерминации равен р =0,924 =0,854 означает, что 85,4% изменчивости Y объясняется изменением X, остаток 14,6% изменчивости Y объясняется неучтенными факторами.

7. Множественная регрессия.

На практике, как правило, встречаются процессы, характер протекания которых детерминированным образом зависит не от одной, а от нескольких определенных величин хь х2,...,Хк. Например, выпуск продукции зависит от затрат труда, затрат фондов и т. д. Можно учитывать много факторов, но на практике это не целесообразно. Поэтому выделяют пару основных факторов.

Переменные хь х2,..., хк обычно называют независимыми переменными (или регрессантами, факторами). Их возможные значения принадлежат некоторой области k-мерного пространства. Переменную у = f(xb x2,..., хк) называют зависимой переменной (или регрессором).

Многофакторная линейная регрессивная модель может быть записана в виде

Y= Ро + Pi xi+ p2 x2+...+ Pj Xj+...+ pkxk+s,

где у - зависимая переменная; хь х2,..., хк - независимые переменные (факторы,); Ро, Рь р2, ..., Рк - параметры модели, которые необходимо оценить; s -ненаблюдаемая случайная величина.

у = х- 0,6

Пусть имеется п наблюдаемых значений (у,хь х2,..., Хк)

У

Xi

х2

У1

Xi 1

Xl2

У2

Х21

Х22

yn Xni Xn2 ... X

Для этих значений имеем

Yt= Ро + Pi Xti+ p2 Xt2+... + pj Xtj+... + pk Xtk+St

ИЛИ

У,=Р„ + 1РД«, (t = 1.2,...,nX

Уравнение (1) может быть записано в матричном виде

у = х р + s,

Предполагается, что выполняются следующие условия.

А1. Математическое ожидание случайной величины 8 равно нулю.

Е (st / xti, Xt2,..., Xtk) = 0 для каждого t.

A2. Случайные величины st независимы между собой,

cov(Si,Ej) =0, i^j.

A3. Модель гомоскедастична, то есть ошибки имеют одинаковую дисперсию для любого наблюдения

var (si) = a2.

А4. Ковариация между случайной величиной Si и каждой независимой переменной х равна нулю.

А5. Случайная величины s соответствует нормальному распределению с нулевым математическим ожиданием и постоянной дисперсией.

Кроме того, модель должна быть правильно специфицированной и не должно быть точно линейной связи между двумя или больше факторами.

Для оценки неизвестных параметров р0, Рь Рг,--, Р к чаще всего используют следующие критерии.

1. Метод наименьших квадратов (МНК).

mini (У -f(xt,P))2^o,

Xt=(XtbX12,...,X1k).

В результате получают среднеквадратическую регрессию.

2. Метод наименьших модулей.

miniyt-f(xt,P)^o. (3)

р t=i г1

В данном случае регрессия называется среднеабсолютной.

3. Минимаксный метод

Регрессия называется минимаксной.

Рассмотрим оценку параметром линейной множественной регрессии с помощью метода наименьших квадратов. Используя матричное уравнение (2)

и соотношение (3), нетрудно показать, что оценка Р параметра Р имеет вид

Р = xV ХТУ,

где х транспонированная матрица х и выборочное уравнение регрессии имеет вид

у = В + В х +В х +... + В.Х. +... + 6,х, .

Jк0 к1 1 к2 2 Kj j *к к

Оценка МНК множественной линейной регрессии является несмещенной, состоятельной и эффективной.

После того, как получена оценка р параметра Р, проверяют значимость уравнения регрессии, т.е. проверяется гипотеза

Н0: Pi = p2= ... =Pk = 0

против гипотезы

Нь хотя бы одно значение не равно Р i (i =1, 2, ... к), не равно нулю.

Для проверки гипотезы используют F - критерий Фишера.

Если в результате проверки один (или более) параметр окажется несущественным, то его исключают из уравнения регрессии. После чего вновь проводят оценку параметров модели, но уже с меньшим числом переменных.

Пример 1.2. Найти уравнение многофакторной регрессии и определить значимость параметров регрессии по данным табл. 1.3.

Таблица 1.3

t

Yt

Xtl

Xt2

1

8

3

1

2

10

4

2

3

16

6

8

4

11

3

5

5

12

4

6

6

8

2

5

7

11

4

3

8

9

3

2

9

14

7

8

10

15

9

10

Вычислим матрицу х у и следовательно, оценка уравнения регрессии имеет вид

у =6,308 + 0,654 xi + 0,430 х2.

Уравнение регрессии легко получить с помощью EXCEL. Для этого выполняем следующие действия: Данные, Сервис, Анализ данных, Регрессия, Enter, Y Enter, Х(оба столбца) Enter, Enter.

Не экране получим следующее решение.

ВЫВОД. ИТОГОВ

Регрессионная

статистика

Множественный R

0,908596091

R-квадрат

0,825546857

Нормированный

0,775703102

R-квадрат

Стандартная

1,343258699

ошибка

Наблюдения

10

Дисперсионный анализ

df SS MS

Регрессия 2 59,76959248 29,88479624 Остаток 7 12,63040752 1,804343932 Итого 9 72,4

Коэффициенты

Стан- t-дартная ошибка статистика

Р-Значение

Y-пересечение Переменная X1 Переменная X 2

6,307523511 0,653605016 0,430250784

1,019894347 6,184487175 0,340518923 1,919438164 0,245148246 1,755063687

0,00045203 0,09640943 0,12268314

F Значимость F

Регрессия 16,5626939 0,002217562

Остаток

Итого

Нижние 95% Верхние 95%

Y-пересечение 3,895858328 8,719188694 Переменная Х1 0,151593711 1,458803742 Переменная X 2 0,149432288 1,009933856

Проверяем значимость коэффициентов Р j, j = 1,2 при уровне значимости а = 0,05.

Сначала вычисляем несмещенную оценку дисперсии ошибок

£2 =E(yt-yt)2

n-m-1 где:

yt - значения зависимой переменной;

n - число наблюдений;

m - число оцениваемых параметров.

Таблица 1.4

t

yt

(yt-yt)2

1

8,700

0,490

2

9,784

0,046

3

13,672

5,419

4

10,420

0,336

5

11,504

0,246

6

9,766

3,118

7

10,214

0,618

8

9,130

0,017

9

14,326

0,106

10

16,494

2,232

S

12,628

Отсюда

J>t-yt2 =12,628.

Тогда

§2=J2!628_ = 10-2-1

Вычисляем дисперсии оценок 3., j = 1,2.

S2(p.) = sV, j = 1,2,

где bjj - диагональные элементы матрицы (х х)" .

S2(B ) = 1,804----------= 0,160,

S2(B ) = 1,804—^- = 0,080. VH27 12760

По таблице t - распределения Стьюдента находим

tKp = tKp(a, n-m-1), т.е. tKp (0,05; 7) = 2,365.

1. Проверяем гипотезу H0: P i = 0.

Так как |tHa6 I < tKp, то нет основания опровергнуть гипотезу Н0, коэффициент р 1 не значим.

2. Проверяем гипотезу Н0: Р г = 0

t =^ = ^L = 1,520. наб S(P2) V0,080

Коэффициент р 2 значим.

Таким образом, из уравнения регрессии исключаем переменную хь имеющую незначимый коэффициент.

Исключив переменную хь получаем простую линейную регрессию вида

Еще раз оцениваем коэффициенты регрессии.

В =у-В х .

К0 JК2 2

Отсюда g2 = 0,805, Ро = 7,375.

Значит, оценка уравнения регрессии есть

у = 7,375 + 0,805х .

Его также можно получить с помощью EXCEL:

R-квадрат

0,733728608

Нормированный R-квадрат

0,700444684

Стандартная ошибка

1,552338912

Наблюдения

10

Дисперсионный анализ

df

SS

MS

Регрессия

Остаток

Итого

1 8 9

53,12195122 19,27804878 72,4

53,12195122 2,409756098

Коэффициенты

Стандартная ошибка

t-статистика

Р-Значение

Y-пересечение Переменная X 1

7,375609756 0,804878049

0,987753687 0,171427155

7,46705363 4,695160744

7,14765Е-05 0,001551136

F

Значимость F

Регрессия

Остаток

Итого

22,04453441

0,001551136

Нижние 95%

Верхние 95%

Y-пересечение Переменная X 1

5,097844196 0,409566065

9,653375317 1,200190033

Проверяем значимость коэффициента Рг при уровне значимости а

Таблица 1.5

t

yt

(Yt-У:)2

1

8,18

0,0324

2

8,985

1,0302

3

13,815

4,7742

4

11,4

0,16

5

12,205

0,0420

6

11,4

11,56

7

9,772

1,5080

8

8,985

0,0002

9

13,815

0,0342

10

15,425

0,1806

S

19,3218

Отсюда  (у -у) =19,3218. Несмещенная оценка дисперсии

S2(|3 ) = 2,415-^- = 0,107. VH27 12760

Из таблицы Стьюдента имеем tKp (0,05; 8) = 2,306.

Так как

Р2 0,805 лгл

то коэффициент р2 значим.

Окончательно оценка регрессии со значимыми коэффициентами имеет вид

у = 7,375 + 0,805х .

Коэффициент при х2 показывает, что при увеличении значения х2 на одну

единицу, значение у в среднем увеличивается на 0,805 единицы. Строим доверительный интервал для параметра р2.

где ty - критическое значение, определяемое по таблице Стьюдента при уровне значимости а = 1 - у;

Р е{0,805±2,306Л/0,012 }

(Здесь tKp (а; к) = tKp (0,05; 10-2) = 2,306). Или 0,552 <р2< 1,058.