Математические основы изучения экономического риска

При анализе экономического риска рассматривают его качественную, количественную и правовую стороны. Для численного выражения риска используется определенный математический аппарат. Основными математическими понятиями, которые возникают при количественной оценке риска, являются: вероятность, случайная величина, математическое ожидание, дисперсия (вариация), коэффициент вариации, коэффициент корреляции, проценты, простейшие функции и их графики, матрица, производная. Эти понятия надо знать и глубоко понимать.

Фундаментальными понятиями в этом курсе и в статистическом анализе является понятие вероятности и случайной величины (переменной). Под термином случайная величина в теории вероятностей понимается не всякая переменная величина, которая принимает случайные, наперед неизвестные неопределенные значения.

Случайной переменной мы называем переменную, которая под воздействием случайных факторов может с определенными вероятностями принимать те или иные значения из некоторого множества чисел.

Случайная величина - это переменная, которой даже при фиксированных обстоятельствах мы не можем приписать определенное значение, но можем приписать несколько значений, которые она принимает с определенными вероятностями.

Под вероятностью некоторого события (например, события, состоящего в том, что случайная переменная приняла определенное значение) обычно понимается доля числа исходов, благоприятствующего данному событию в общем числе возможных равновероятных исходов.

Случайные величины обозначают буквами: X, Y,^ ,R, Ri x и т.д.

Основными характеристиками случайных величин являются следующие величины.

1. Математическое ожидание (среднее значение) случайной величины.

Математическое ожидание дискретной случайной величины X находится по формуле

M(X) = m = m_x = ЕР ^х

где Xi - значения случайной величины;

Pi - вероятности, с которыми эти значения принимаются.

Математическое ожидание непрерывной случайной величины X находится по формуле

М(Х) = jxf (x)dx,

где f(x) - плотность распределения значений случайной величины.

2. Дисперсия (вариация) и среднеквадратическое отклонение случайной величины.

Дисперсия - это степень рассеянности (разброса) значений случайной величины вокруг своего среднего значения. Дисперсия и среднеквадратическое отклонение случайной величины находятся, соответственно, по формулам:

D(X) = V = М(Х - М(Х))² = М(Х²) - (М(Х))²,

V = g²,g = g_x=Vd(x),

D(X)= V=V_XX,

D(X) = XPixf - (M(X))²,D(X) = jx²f(x)dx- (M(X))².

3. Ковариация.

Ковариация - вспомогательная величина. Ковариация между случайными величинами X,Y обозначается cov(X,Y) или V .

Ковариацией (корреляционным моментом) называется величина

^VXY = ^KXY = ^M*^X - ^M(^X))(^Y - ^M(^Y))}

4. Коэффициент корреляции.

Коэффициентом корреляции называется величина

P_XY=^(-i<P_XY<i).

Если

p = 1 - полная прямая линейная корреляция,

р = -1 - полная обратная линейная корреляция,

р =0- XhY- некоррелированные случайные величины.

Оценка тесноты линейной связи производится по следующей таблице.

Таблица 1.1

Теснота связи	Значение рху
Теснота связи	Прямая связь	Обратная связь
Слабая	0,1-0,3	(-0,3)-(-0,1)
Средняя	0,3 - 0,7	(- 0,7) - (- 0,3)
Тесная	0,7-1	(-!)-(-0,7)

В случае нелинейной зависимости между случайными величинами X и

Y коэффициент корреляции р_ху нельзя использовать для выявления тесноты связи. Его вычисление при нелинейной зависимости позволяет:

a) охарактеризовать степень приближения исследуемой корреляционной зависимости к функциональной;

b) сделать предварительную оценку тесноты корреляционной зависимости.

Заметим, что в большинстве практических задач измерение тесноты связи начинают с вычисления коэффициента корреляции.

Коэффициент корреляции - безразмерная величина. Если с „ростом" одной величины „растет" и другая, то р >0, если с „ростом" одной - дру-

гая величина „уменьшается", то р <0. Близкая к нулю величина коэффици-

ента корреляции говорит об отсутствии линейной связи между переменными, но не об отсутствии связи между ними вообще. Корреляционный момент

V , как и коэффициент корреляции, характеризирует степень линейной связи величин XhY. Коэффициент корреляции - это нормированный корреляционный момент. Ковариация сама по себе используется редко; она обычно фигурирует как промежуточный элемент расчета коэффициента корреляции. Геометрическая интерпретация коэффициента корреляции проиллюстрирована на рис. 1.1- рис. 1.6.

Положительная корреляция между X и Y

Отрицательная корреляция между X и Y

Полная прямая линейная корреляция между X и Y

Банки, риски, стратегии
Рис. 1.5. X и Y некоррелированные и независимы

Полная обратная линейная корреляция между X и Y независимы

Банки, риски, стратегии

Рис. 1.6.Х и Y некоррелированные,но зависимы

На практике оценки характеристик случайной величины находят по другим формулам:

5. Коэффициент детерминации.

Наряду с коэффициентом корреляции для исследования тесноты связи между величинами X и Y используют еще одну характеристику - коэффициент детерминации.

Коэффициент детерминации показывает, какая часть изменения Y вызванная изменением величины X. Остаток изменения Y вызван неучтенными факторами. Коэффициент детерминации - показатель адекватности регрессивной модели.

Коэффициент детерминации равен квадрату коэффициента корреляции

Х(У;-У)'

Х(у₁-у)^:

где у_; - теоретические значения случайной величины Y.

6. Уравнение линейной регрессии.

Уравнение линейной регрессии Y на X имеет вид

y-m_Y*x-m.

Пример 1.1. По выборочным данным для случайных величин X и Y (табл. 1.2) найти оценки математического ожидания, дисперсии, ковариации между X и Y. Найти уравнение линейной регрессии Y на X.

Таблица 1.2

X	4	2	3	1	3	4	2	5	4	2
Y	3	1	2	1	3	4	1	4	4	1

Аналогично вычисляем у = 2,4 и у =7,4. Теперь находим

а|=^(10,4-3²) = 1,556, a_x=VU556 = 1,247,

a_Y= —(7,4-2,4²) = 1,822, a_Y =^1,822 = 1,350,

10 V_w=—(8,6- 3-2,4) = 1,556, рху=—Ь^— = 0,924.

Уравнение линейной регрессии Y на X:

y-2,4 = 0,924 -i^(x-3)=>

1,247

y=l,000x-0,601. Корреляционное поле и линия регрессии на нем выглядят так.

То, что коэффициент корреляции р = 0.924 ~ 1 означает, что между X и Y есть тесная линейная связь. Это видно и из рис. 1.7: точки (xi,yi) расположены вдоль прямой у = х - 0,6.

То, что коэффициент детерминации равен р =0,924 =0,854 означает, что 85,4% изменчивости Y объясняется изменением X, остаток 14,6% изменчивости Y объясняется неучтенными факторами.

7. Множественная регрессия.

На практике, как правило, встречаются процессы, характер протекания которых детерминированным образом зависит не от одной, а от нескольких определенных величин х_ь х₂,...,Хк. Например, выпуск продукции зависит от затрат труда, затрат фондов и т. д. Можно учитывать много факторов, но на практике это не целесообразно. Поэтому выделяют пару основных факторов.

Переменные х_ь х₂,..., х_к обычно называют независимыми переменными (или регрессантами, факторами). Их возможные значения принадлежат некоторой области k-мерного пространства. Переменную у = f(x_b x₂,..., х_к) называют зависимой переменной (или регрессором).

Многофакторная линейная регрессивная модель может быть записана в виде

Y= Ро + Pi xi+ p₂ x₂+...+ Pj Xj+...+ p_kx_k+s,

где у - зависимая переменная; х_ь х₂,..., х_к - независимые переменные (факторы,); Ро, Рь р₂, ..., Рк - параметры модели, которые необходимо оценить; s -ненаблюдаемая случайная величина.

у = х- 0,6

Пусть имеется п наблюдаемых значений (у,х_ь х₂,..., Хк)

У	Xi	х₂
У1	Xi 1	Xl2
У2	Х₂1	Х₂2

y_n X_ni Xn2 ... X

Для этих значений имеем

Yt= Ро + Pi X_ti+ p₂ X_t2+... + pj Xtj+... + pk X_tk+St

ИЛИ

У,=Р„ + 1РД«, (t = 1.2,...,nX

Уравнение (1) может быть записано в матричном виде

у = х р + s,

Предполагается, что выполняются следующие условия.

А1. Математическое ожидание случайной величины 8 равно нулю.

Е (s_t / x_ti, Xt2,..., Xtk) ⁼ 0 для каждого t.

A2. Случайные величины s_t независимы между собой,

cov(Si,Ej) =0, i^j.

A3. Модель гомоскедастична, то есть ошибки имеют одинаковую дисперсию для любого наблюдения

var (si) = a².

А4. Ковариация между случайной величиной Si и каждой независимой переменной х равна нулю.

А5. Случайная величины s соответствует нормальному распределению с нулевым математическим ожиданием и постоянной дисперсией.

Кроме того, модель должна быть правильно специфицированной и не должно быть точно линейной связи между двумя или больше факторами.

Для оценки неизвестных параметров р₀, Рь Рг,--, Р к чаще всего используют следующие критерии.

1. Метод наименьших квадратов (МНК).

mini (У -f(x_t,P))²^o,

X_t=(XtbX₁₂,...,X_1k).

В результате получают среднеквадратическую регрессию.

2. Метод наименьших модулей.

miniy_t-f(x_t,P)^o. (3)

р t=i ^г¹

В данном случае регрессия называется среднеабсолютной.

3. Минимаксный метод

Регрессия называется минимаксной.

Рассмотрим оценку параметром линейной множественной регрессии с помощью метода наименьших квадратов. Используя матричное уравнение (2)

и соотношение (3), нетрудно показать, что оценка Р параметра Р имеет вид

Р = xV Х^Т_У,

где х транспонированная матрица х и выборочное уравнение регрессии имеет вид

у = В + В х +В х +... + В.Х. +... + 6,х, .

^J^к0 ^к1 1 ^к2 2 ^Kj j *к к

Оценка МНК множественной линейной регрессии является несмещенной, состоятельной и эффективной.

После того, как получена оценка р параметра Р, проверяют значимость уравнения регрессии, т.е. проверяется гипотеза

Н₀: Pi = p₂= ... =Pk = 0

против гипотезы

Нь хотя бы одно значение не равно Р i (i =1, 2, ... к), не равно нулю.

Для проверки гипотезы используют F - критерий Фишера.

Если в результате проверки один (или более) параметр окажется несущественным, то его исключают из уравнения регрессии. После чего вновь проводят оценку параметров модели, но уже с меньшим числом переменных.

Пример 1.2. Найти уравнение многофакторной регрессии и определить значимость параметров регрессии по данным табл. 1.3.

Таблица 1.3

t	Yt	Xtl	X_t2
1	8	3	1
2	10	4	2
3	16	6	8
4	11	3	5
5	12	4	6
6	8	2	5
7	11	4	3
8	9	3	2
9	14	7	8
10	15	9	10

Вычислим матрицу х у и следовательно, оценка уравнения регрессии имеет вид

у =6,308 + 0,654 xi + 0,430 х₂.

Уравнение регрессии легко получить с помощью EXCEL. Для этого выполняем следующие действия: Данные, Сервис, Анализ данных, Регрессия, Enter, Y Enter, Х(оба столбца) Enter, Enter.

Не экране получим следующее решение.

ВЫВОД. ИТОГОВ

Регрессионная	статистика
Множественный R	0,908596091
R-квадрат	0,825546857
Нормированный	0,775703102
R-квадрат
Стандартная	1,343258699
ошибка
Наблюдения	10

Дисперсионный анализ

df SS MS
Регрессия 2 59,76959248 29,88479624 Остаток 7 12,63040752 1,804343932 Итого 9 72,4

	Коэффициенты	Стан- t-дартная ошибка статистика	Р-Значение
Y-пересечение Переменная X1 Переменная X 2	6,307523511 0,653605016 0,430250784	1,019894347 6,184487175 0,340518923 1,919438164 0,245148246 1,755063687	0,00045203 0,09640943 0,12268314

F Значимость F
Регрессия 16,5626939 0,002217562 Остаток Итого

Нижние 95% Верхние 95%
Y-пересечение 3,895858328 8,719188694 Переменная Х1 0,151593711 1,458803742 Переменная X 2 0,149432288 1,009933856

Проверяем значимость коэффициентов Р j, j ⁼ 1,2 при уровне значимости а = 0,05.

Сначала вычисляем несмещенную оценку дисперсии ошибок

£2 ₌E(y_t-yt)²

n-m-1 где:

y_t - значения зависимой переменной;

n - число наблюдений;

m - число оцениваемых параметров.

Таблица 1.4

t	y_t	(y_t-y_t)²
1	8,700	0,490
2	9,784	0,046
3	13,672	5,419
4	10,420	0,336
5	11,504	0,246
6	9,766	3,118
7	10,214	0,618
8	9,130	0,017
9	14,326	0,106
10	16,494	2,232
S		12,628

Отсюда

J>t-y_t² =12,628.

Тогда

_§2=J2_!628_ ₌ 10-2-1

Вычисляем дисперсии оценок 3., j = 1,2.

S²(p.) = sV, j = 1,2,

где bjj - диагональные элементы матрицы (х х)" .

S²(B ) = 1,804----------= 0,160,

S²(B ) = 1,804—^- = 0,080. ^VH2⁷ 12760

По таблице t - распределения Стьюдента находим

t_Kp = t_Kp(a, n-m-1), т.е. t_Kp (0,05; 7) = 2,365.

1. Проверяем гипотезу H₀: P i = 0.

Так как |t_Ha6 I < t_Kp, то нет основания опровергнуть гипотезу Н₀, коэффициент р 1 не значим.

2. Проверяем гипотезу Н₀: Р г = 0

t =^ = ^L = 1,520. ^наб S(P₂) V0,080

Коэффициент р ₂ значим.

Таким образом, из уравнения регрессии исключаем переменную х_ь имеющую незначимый коэффициент.

Исключив переменную х_ь получаем простую линейную регрессию вида

Еще раз оцениваем коэффициенты регрессии.

В =у-В х .

^К0 ^J^К2 2

Отсюда g₂ = 0,805, Р_о = 7,375.

Значит, оценка уравнения регрессии есть

у = 7,375 + 0,805х .

Его также можно получить с помощью EXCEL:

R-квадрат	0,733728608
Нормированный R-квадрат	0,700444684
Стандартная ошибка	1,552338912
Наблюдения	10

Дисперсионный анализ

		df	SS	MS
Регрессия Остаток Итого		1 8 9	53,12195122 19,27804878 72,4	53,12195122 2,409756098
	Коэффициенты		Стандартная ошибка	t-статистика	Р-Значение
Y-пересечение Переменная X 1	7,375609756 0,804878049		0,987753687 0,171427155	7,46705363 4,695160744	7,14765Е-05 0,001551136
	F		Значимость F
Регрессия Остаток Итого	22,04453441		0,001551136
	Нижние 95%		Верхние 95%
Y-пересечение Переменная X 1	5,097844196 0,409566065		9,653375317 1,200190033

Проверяем значимость коэффициента Рг при уровне значимости а

Таблица 1.5

t	y_t	(Yt-У:)²
1	8,18	0,0324
2	8,985	1,0302
3	13,815	4,7742
4	11,4	0,16
5	12,205	0,0420
6	11,4	11,56
7	9,772	1,5080
8	8,985	0,0002
9	13,815	0,0342
10	15,425	0,1806
S		19,3218

Отсюда (у -у) =19,3218. Несмещенная оценка дисперсии

S²(|3 ) = 2,415-^- = 0,107. ^VH2⁷ 12760

Из таблицы Стьюдента имеем t_Kp (0,05; 8) = 2,306.

Так как

Р₂ 0,805 _лгл

то коэффициент р₂ значим.

Окончательно оценка регрессии со значимыми коэффициентами имеет вид

у = 7,375 + 0,805х .

Коэффициент при х₂ показывает, что при увеличении значения х₂ на одну

единицу, значение у в среднем увеличивается на 0,805 единицы. Строим доверительный интервал для параметра р₂.

где ty - критическое значение, определяемое по таблице Стьюдента при уровне значимости а = 1 - у;

Р е{0,805±2,306_Л/0,012 }

(Здесь t_Kp (а; к) = t_Kp (0,05; 10-2) = 2,306). Или 0,552 <р₂< 1,058.