THE PROBLEM OF OPTIMAL STOCHASTIC CONTROL AND CORPORATE BOND VALUATION, DEPENDING ON TIME AND RANDOM STATES OF PARAMETERS

Oliver D. Foka; Dmitrochenko   Oleg

doi:doi:10.30987/2658-6436-2024-3-53-64

THE PROBLEM OF OPTIMAL STOCHASTIC CONTROL AND CORPORATE BOND VALUATION, DEPENDING ON TIME AND RANDOM STATES OF PARAMETERS

Submit manuscript Download PDF
Text

To cite

Citations:

THE PROBLEM OF OPTIMAL STOCHASTIC CONTROL AND CORPORATE BOND VALUATION, DEPENDING ON TIME AND RANDOM STATES OF PARAMETERS

Journal: AUTOMATION AND MODELING IN DESIGN AND MANAGEMENT Volume 2024 № 3 , 2024

Rubrics: MATHEMATICAL AND COMPUTER MODELING

UDC 519.86

Oliver D. Foka ¹

Dmitrochenko Oleg ²

Author and publication information

Authors:

1. Bryansk State Technical University

Russian Federation

2. Bryanskiy gosudarstvennyy tehnicheskiy universitet (Docent)

Type:

Article

DOI:

https://doi.org/10.30987/2658-6436-2024-3-53-64

Pages:

from 53 to 64

Status:

Published

Received:

16.05.2024

Accepted:

24.05.2024

Published:

30.09.2024

Subject area:

UDC 519.86

Language:

Russian

Keywords:

stochastic process, optimal control, dynamic programming

Abstract and keywords

Abstract:
In the optimal stochastic control problem, one estimates, using the utility indifference method, the bond price and the premium of a default swap contract (Credit default swap) when the model parameters (market interest rate, drift coef-ficient, and volatility of risky underlying assets) are random functions of time and state. Namely, the interest rate of the risk-free asset depends on time, and the prices of risky assets are described by linear homogeneous stochastic dif-ferential equations (SDEs) with multiplicative noise. To do this, the authors consider a portfolio with a risk-free asset and a risky asset with no default risk. For each such portfolio, the authors determine the amount of risky assets that maximizes the expected utility of its final wealth. This quantity allows one to solve the parabolic partial differential equations arising from the Hamilton-Jacobi-Bellman (HJB) equation by transforming them into ordinary differential equations using the method of variable separation to obtain the instantaneous value function of each portfolio. The authors derive the bond price and the default swap-contract premium (CDS) rate, which are the amounts that provide the same level of the expected utility by investing all of one’s wealth in a portfolio that does not contain these credit instruments, or by investing these amounts in credit instruments and the remainder of one’s wealth in the portfolio.

Keywords:
stochastic process, optimal control, dynamic programming

Text

Text (PDF): Read Download

Введение

Торговля осуществляется между банковским счетом и акционным счетом, при этом цена акций моделируется как процесс диффузии. Основное предположение состоит в том, что коэффициенты последнего зависят от времени и стохастического состояния процесса. В классической модели динамического выбора портфеля Р. Мертона предполагается, что доходности и волатильности рисковых активов являются константами или детерминистическими функциями. Однако многие явления, такие как смайлы волатильности и другие, не могут быть объяснены в рамках моделей с постоянной волатильностью. В литературе существует много работ, которые анализируют стохастическую волатильность в различных финансовых моделях.
Например, В. Хендерсон и Д. Хобсон [5] изучают цены опционов в рамках различных мартингальных мер. Важным классом моделей является класс моделей, связанных с максимизацией полезности. В таких моделях цель состоит в максимизации полезности богатства (накопительного или терминального). Много статей было посвящено изучению этой проблемы в стохастической среде. С целью нахождения оптимального портфеля путем максимизации ожидаемых функций полезности для терминального богатства в стохастической волатильной среде, Т. Зарифопулу [2] представляет упрощенные решения и выражает функцию стоимости через решение линейного параболического уравнения.
Благодаря работе Р. Мертона [3] в 1969 году по проблемам инвестирования, связанным с проблемами С. Ходжеса [6] в 1989 году, относящимися к двум сценариям этих проблем, Ж. Сиглох [4] в 2009 году в своей диссертации оценил безразличную цену облигации и безразличную премию КДС, предполагая, что параметры модели (процентная ставка, коэффициент сноса и волатильность) являются постоянными. Мы используем коэффициенты, которые зависят от времени и стохастического состояния процесса для оценки безразличной цены облигации и безразличной премии КДС с целью обобщения работ Ж. Сиглоха.

Материалы, модели, эксперименты и методы

Постановка модели. Рассмотрим инвестора, который в момент времени t имеет самофинансируемый портфель с Q_t^0 безрисковыми активами стоимостью M_t, подверженными процентной ставке r_t, и Q_t^1,Q_t^2,…,Q_t^n бездефолтными рисковыми активами со стоимостями A_t^1,A_t^2,…,A_t^n соответственно. Динамика этих активов описывается следующим образом:

∀t∈[0,T],dM_t=r_t M_t dt (динамика безрисковых активов);
∀t∈[0,T],∀i∈\{1,…,n\},dA_t^i=A_t^i (μ_t^i dt+σ_t^i dB_t^i ) (динамика рисковых активов),
где μ_t^i и σ_t^i – коэффициенты сноса и диффузии соответственно.
Заметим, что dB_t^i dB_t^j=ρ_ij dt, где ρ_ij – коэффициент корреляции между B_t^i и B_t^j. В дальнейшем будем считать B_t^i и B_t^j сильно коррелированными и полагать ρ_ij=1.
В любой момент времени t разумно предположить, что инвестор имеет полную информацию о ценах рисковых активов A_s^1,…,A_s^n для 0≤s≤t. Мы моделируем информационное состояние инвестора с помощью фильтрации (F_t )_(t∈[0,T] ), где F_t=σ(\{B_s^1,…,B_s^n:0≤s≤t\}∪N) где N – множество подмножеств Ω нулевой меры, фильтрация (F_t ) удовлетворяет обычным условиям: она правосторонне непрерывна и увеличивается. F_0 содержит все множества нулевой меры, а F_T представляет собой всю доступную информацию на [0,T].
В момент времени t богатство инвестора в безрисковом активе равно 〖π_0=π〗_0 (t)=Q_t^0 M_t, в i-м рисковом активе равно π_i=π_i (t)=Q_t^i A_t^i, а общее богатство Λ_t инвестора составляет:
Λ_t=π_0 (t)+∑_(i=1)^n▒〖π_i (t) 〗. (1)
Динамика процесса богатства задается стохастическим дифференциальным уравнением:
"d" Λ_t=[r_t Λ_t+π(t)^T (μ_t-r_t )]"d" t+〖∑_(i=1)^n▒〖π_i (t) 〗 σ〗_t^i dB_t^i. (2)
Доказательство. Поскольку портфель является самофинансируемым, дифференциал благосостояния Λ_t, определенный в (2), дает:
"d" Λ_t=Q_t^0 dM_t+∑_(i=1)^n▒〖Q_t^i dA_t^i 〗=Q_t^0 r_t M_t dt+∑_(i=1)^n▒Q_t^i A_t^i [μ_t^i dt+σ_t^i dB_t^i ]=
=π_0 (t) r_t dt+∑_(i=1)^n▒〖π_i (t) μ_t^i dt〗+∑_(i=1)^n▒〖π_i (t) σ_t^i 〖dB〗_t^i 〗,
поскольку π_0 (t)=Λ_t-∑_(i=1)^n▒〖π_i (t) 〗, тогда:
"d" Λ_t=(Λ_t-∑_(i=1)^n▒〖π_i (t) 〗) r_t dt+∑_(i=1)^n▒〖π_i (t) μ_t^i 〗 dt+∑_(i=1)^n▒〖π_i (t) σ_t^i dB_t^i 〗=
=r_t Λ_t dt-∑_(i=1)^n▒〖π_i (t) r_t dt〗+∑_(i=1)^n▒〖π_i (t) μ_t^i dt〗+∑_(i=1)^n▒〖π_i (t) σ_t^i dB_t^i 〗.
Тогда, мы получаем:
"d" Λ_t=[r_t Λ_t+π(t)^T (μ_t-r_t )]"d" t+∑_(i=1)^n▒〖π_i (t) σ_t^i dB_t^i 〗.
Мы примем следующие обозначения: r_t=(r_t,…,r_t )^T∈R^n – вектор процентной ставки, π=π(t)=(π_1 (t),…,π_n (t))^T∈R^n – вектор богатства портфель рискованных активов инвестор, Σ_t=(σ_t^i σ_t^j )_(1≤i,j≤n) – (симметричная и невырожденная) ковариационная матрица рискованных активов, μ_t=(μ_t^1,…,μ_t^n )^T∈R^n – вектор коэффициента дрейфа рискованных активов, A_s – набор подходящих стратегий портфеля без дефолтов.
Определение. Процесс π(t)=(π_1 (t),…,π_n (t))^T,F_t – адаптированный – допустимая стратегия портфеля, если E(∫_0^T▒〖π^2 (t)dt〗)<+∞.

Замечание. Функция ценности оптимизационной задачи задается:
Ψ(t,λ)=〖sup┬(π∈R^n ) E〗⁡[u(Λ_T )│Λ_t=λ]                   (3)
и удовлетворяет уравнению в частных дифференциалах (известному как уравнение в частных дифференциалах ГЯБ):
{█(∂Ψ/∂t (t,λ)+sup┬(π∈R^n )⁡〖G^π 〗 Ψ(t,λ)=0;@Ψ(T,λ)=u(λ), λ∈R,)┤                   (4)
где G^π Ψ(t,λ)=r_t λ ∂Ψ/∂λ (t,λ)+1/2 π(t)^T Σ_t π(t) (∂^2 Ψ)/(∂λ^2 ) (t,λ)+π(t)^T (μ_t-r_t ) ∂Ψ/∂λ (t,λ) – бесконечно малый генератор; Λ_T – конечное богатство; u – функция полезности CARA (Constant Absolute Risk Aversion), которая является вогнутой и неубывающей:
u(x)=-e^(-γx),γ> 0                   (5)

где γ – коэффициент склонности к риску.
Представление функции стоимости в разделяемой форме Ψ(t,λ)=u(λ)g(t) позволяет выделить функцию g, которая обычно неизвестна и удовлетворяет уравнению обыкновенное дифференциальное уравнение (ОДУ), с g:[0,T]→R_+^⋆ – производная функция на [0,T] и проверяющая g(T)=1.
Теорема 1.
а) решение уравнения в частных производных (4) задается выражением:
Ψ(t,λ)=-e^(-γλ+∫_t^T▒〖β_s ds〗)                   (6)
где β_t=r_t λ-1/2 (μ_t-r_t )^T Σ_t^(-1) (μ_t-r_t )
б) оптимальный портфель в частных производных (4) задается выражением:
π^⋆ (t)=-1/γ Σ_t^(-1) (μ_t-r_t ).                   (7)
Доказательство. Критическая точка G^π Ψ через условие оптимальности первого порядка задается:
π^⋆ (t)=-(∂Ψ/∂λ (t,λ))/((∂^2 Ψ)/(∂λ^2 ) (t,λ) ) Σ_t^(-1) (μ_t-r_t )=-1/γ Σ_t^(-1) (μ_t-r_t )
Подставляя π^⋆ (t) в уравнение Гамильтона-Якоби-Беллмана (4), получаем:
∂Ψ/∂t (t,λ)+r_t λ ∂Ψ/∂λ (t,λ)-1/2 (μ_t-r_t )^T Σ_t^(-1) (μ_t-r_t ) (∂Ψ/∂λ (t))^2/((∂^2 Ψ)/(∂λ^2 ) (t) )=0.
Поскольку Ψ(t,λ)=-e^(-γλ) g(t), то g удовлетворяет следующему обыкновенному дифференциальному уравнению:
        -e^(-γλ) [g^' (t)+(r_t λ-1/2 (μ_t-r_t )^T Σ_t^(-1) (μt-r_t ))g(t)]=0.
Заменяя β_t его значением, получаем:
g^' (t)+β_t g(t)=0
Используя условие g(T)=1, имеем: g(t)=e^∫_t^T▒〖β_s ds〗. Кроме того, поскольку Ψ(t,λ)=-e^(-γλ) g(t), отсюда и следует результат.
Замечание. Функция значения Ψ является вогнутой и неубывающей по отношению к переменной богатства λ благодаря ее тесной зависимости от функции полезности u.

Цены кредитных инструментов в безрисковом портфеле. В течение периода инвестирования агент может инвестировать часть своего богатства в корпоративные облигации C_t или кредитный дефолтный своп (КДС), а остальное – в портфель, состоящий из безрисковых активов стоимостью M_t и рискового актива стоимостью I_t с динамикой:
∀t≥0,"d" I_t=I_t [μ_t^1 dt+σ_t^1 dB_t^1 ]
где B_t^1 – стандартное броуновское движение.
Целью этого раздела является определение цены каждого из этих двух кредитных инструментов методом оценки на основе безразличия полезности. Отметим, что модель оценки дефолта субъекта отсылки – это модель в сокращенной форме который моделируется пуассоновским процессом (N_t )_(t≥0) с N_0=0 и постоянной интенсивностью κ, а время наступления дефолта обозначается τ_d и определяется как:
τ_d= inf⁡\{t≥0|N_{t}=1 \}.
Построим этот раздел, оценивая методом равнодушия полезности цену корпоративной облигации C_t для портфеля с безрисковыми активами и рисковыми активами без дефолта. Допустим, что эта цена обеспечивает инвестору тот же уровень ожидаемой полезности, что и вложение остатка его состояния λ-C_t в безрисковые активы M_t и рисковые активы I_t, или вложение всего своего состояния λ в эти же активы. Покупая корпоративную облигацию, инвестор получает номинальную сумму F в случае, если обслуживаемое лицо не дефолтирует до срока погашения T, или получает процент R (предполагается, что является случайной величиной, независимой на интервале (0,1) движения Броуновского B_t) от номинальной суммы в случае дефолта до срока погашения.
Поскольку для будущих денежных потоков эквивалентность уверенности [4, 8] является суммой, которую мы были бы готовы получить без риска относительно ожидаемых будущих денежных потоков, чистая приведенная стоимость инвестиции может быть определена, как сумма эквивалентов определенных денежных потоков, дисконтированных по безрисковой ставке. Уверенность эквивалента R удовлетворяет уравнению: E[u(RFe^(∫_t^T▒〖r_s d〗 s) )]=u((R_t ) ̃Fe^(∫_t^T▒〖r_s d〗 s) ) в [4] и определяется следующим образом:
(R_t ) ̃=-1/(γFe^(∫_t^T▒〖r_s d〗 s) ) ln⁡E [e^(-γRFe^(∫_t^T▒〖r_s d〗 s) ) ].
Динамика благосостояния инвестора с условным требованием определяется следующим образом:
{█("d" ¯Λ_s=[r_s ¯Λ_s+¯π_1 (s)(μ_s^1-r_s )]"d" s+¯π_1 (s) σ_s^1 dB_s@¯Λ_τ=¯Λ_(τ^- )+RF.1_(\{τ≤T\})+F.1_(\{τ>T\}) )┤ (8)

где τ=min⁡(τ_d,T) и ограничение богатства означает, что если дефолт ссылочного лица происходит до погашения (τ≤T), то инвестор получает случайный процент R от номинала, а в противном случае (τ>T) он получает весь номинал.
Любая допустимая стратегия характеризуется ¯π_1 (t), которая представляет собой сумму денег, инвестированных в I_t в момент времени t. Для удобства в дальнейшем мы будем писать ¯π (t) вместо ¯π_1 (t).
Функция стоимости инвестора для портфеля с условной требовательностью определяется как:

¯Ψ (t,λ)=〖sup┬(¯π∈R) E〗⁡[u(¯Λ_T )│¯Λ_t=λ,t<τ_d ]. (9)
Следующее предложение устанавливает УЧП, проверяемое ¯Ψ.
Предложение 1. Функция удовлетворяет:

∂Ψ∂tt,λ+sup¯π∈RGπΨt,λ=0ΨT,λ=uλ+F, λ∈R               (10)
где G^¯π ¯Ψ (t,λ)=r_t λ (∂¯Ψ)/∂λ (t,λ)+1/2 (σ_t^1 )^2 ¯π^2 (t) (∂^2 ¯Ψ)/(∂λ^2 ) (t,λ)+(μ_t^1-r_t ) ¯π (t) (∂¯Ψ)/∂λ (t,λ) +κ[Ψ(t,λ+(R_t ) ̃F,z)-¯Ψ (t,λ,z)],
где ¯Ψ – функция ценности, соответствующая инвестированию в портфель с безрисковым активом M_t и рисковым активом I_t.
    В доказательстве этого результата пишем ¯Λ_t^¯π вместо ¯Λ_t, чтобы подчеркнуть зависимость богатства инвестора от стратегии ¯π.
Доказательство. ¯Ψ (t,¯Λ_t ) является преобразованием процесса (¯Λ_t )_(t∈[0,T] ), ¯π^⋆ – оптимальное управление в (9), ¯Λ_t^(¯π^⋆ )– состояние системы, являющееся решением (8), начинающимся с λ в момент t при управлении ¯π^⋆. Поскольку дефолт на референсном объекте (облигации) вызывается пуассоновским процессом (N_t )_(t≥0), то, применяя формулу Ито между t и t+h, получаем:
¯Ψ (t+h,¯Λ_(t+h)^(¯π^⋆ ) )=¯Ψ (t,¯Λ_t^(π^⋆ ) )+∫_t^(t+h)▒((∂¯Ψ)/∂t (s,¯Λ_s^(¯π^⋆ ) )+[r_s ¯Λ_s^(¯π^⋆ )+(μ_s^1-r_s ) ¯π^⋆ (s)] (∂¯Ψ)/∂λ (s,¯Λ_s^(¯π^⋆ ) ))"d" s++∫_t^(t+h)▒〖1/2 (σ_s^1 )^2 (¯π^⋆ (s))^2 (∂^2 ¯Ψ)/(∂λ^2 ) (s,¯Λ_s^(¯π^⋆ ) )"d" 〗 s+∫_t^(t+h)▒〖σ_s^1 ¯π^⋆ (s) (∂¯Ψ)/∂λ (s,¯Λ_s^(¯π^⋆ ) )"d" B_s^1 〗 +∫_t^(t+h)▒〖[Ψ(s,Λ_s^(π^⋆ )++(〖 R〗_s ) ̃F)-¯Ψ (s,¯Λ_s^(¯π^⋆ ) )]dN_s 〗.
Действительно, когда в момент погашения облигации происходит дефолт, инвестор получает процент (R_t ) ̃ от номинала, составляющий (R_t ) ̃F, и следовательно, новый процесс богатства равен λ+(R_t ) ̃F; в то время как, если дефолта по облигации не происходит, (R_t ) ̃=R=1, и следовательно, новый процесс богатства равен λ+F.
Используя условное математическое ожидание, мы имеем:
E[¯Ψ (t+h,¯Λ_(t+h)^(π^⋆ ) )|¯Λ_t^(π^⋆ )=λ]=¯Ψ (t,¯Λ_t^(π^⋆ ) )+E[∫_t^(t+h)▒((∂¯Ψ)/∂t (s,¯Λ_s^(¯π^⋆ ) )+r_s ¯Λ_s^(¯π^⋆ ) (∂¯Ψ)/∂λ (s,¯Λ_s^(π^⋆ ) ))ds│¯Λ_t^(¯π^⋆ )=λ]+
+ E[∫_t^(t+h)▒(1/2 (σ_s^1 )^2 (¯π^⋆ (s))^2 (∂^2 ¯Ψ)/(∂λ^2 ) (s,¯Λ_s^(π^⋆ ) )+(μ_s^1-r_s ) ¯π^⋆ (s) (∂¯Ψ)/∂λ (s,¯Λ_s^(π^⋆ ) ))ds│¯Λ_t^(¯π^⋆ )=λ]+ E[∫_t^(t+h)▒〖[Ψ(s,Λ_s^(π^⋆ )+(R_s ) ̃F)-¯Ψ (s,¯Λ_s^(¯π^⋆ ) )]dN_s 〗│ ¯Λ_t^(¯π^⋆ )=λ].
При этом:
E[∫_t^(t+h)▒σ_s^1 ¯π^⋆ (s) (∂¯Ψ)/∂λ (s,¯Λ_s^¯π )"d" B_s^1│ ¯Λ_t^(¯π^⋆ )=λ]=0.
Кроме того,
¯Ψ (t,¯Λ_t^¯π )=E[¯Ψ (t+h,¯Λ_(t+h)^(¯π^⋆ ) )│¯Λ_t^(¯π^⋆ )=λ],
Так:
E[∫_t^(t+h)▒((∂¯Ψ)/∂t (s,¯Λ_s^(¯π^⋆ ) )+r_s ¯Λ_s^(¯π^⋆ ) (∂¯Ψ)/∂λ (s,λ))ds│¯Λ_t^(¯π^⋆ )=λ]+
+ E[∫_t^(t+h)▒(1/2 (σ_s^1 )^2 (¯π^⋆ (s))^2 (∂^2 ¯Ψ)/(∂λ^2 ) (s,λ)+(μ_s^1-r_s ) ¯π^⋆ (s) (∂¯Ψ)/∂λ (s,λ))ds│¯Λ_t^(¯π^⋆ )=λ]+E[∫_t^(t+h)▒〖[Ψ(s,Λ_s^(π^⋆ )+(R_s ) ̃F)-¯Ψ (s,¯Λ_s^(¯π^⋆ ) )]dN_s 〗│ ¯Λ_t^(¯π^⋆ )=λ]=0.
И поскольку sup┬(¯π∈R)⁡〖G^¯π ¯Ψ (t,λ)〗=G^(¯π^⋆ ) ¯Ψ (t,λ), то, разделив на h и переходя к пределу при h к 0, мы получаем искомый результат.
Завершим этот раздел, оценив с использованием метода индифферентности полезности цену корпоративной облигации для портфеля с безрисковым рискованным активом. Для этого напомним определение этой цены в соответствии с этим методом, которое утверждает, что это цена, обеспечивающая инвестору тот же ожидаемый уровень полезности, когда он инвестирует оставшуюся часть своего богатства λ-C_t в безрисковый актив M_t и рискованный актив I_t, или когда он инвестирует все свое богатство λ в безрисковый актив M_t и рискованный актив I_t.
Определение. Цена безразличия C_t облигации является решением уравнения ¯Ψ (t,λ--C_t )=Ψ(t,λ), для n=1.
Чтобы определить Ψ=¯Ψ, мы предполагаем, что функция стоимости ¯Ψ записывается в виде ∀t∈[0,T],¯Ψ (t,λ)=-e^(-γλ) ¯h (t), где ¯h:[0,T]→R_+^⋆ является функцией такой, что ¯h (T)==e^(-γF).
Первый основной результат этой работы оценивает цену облигации.
Теорема 2.
Цена безразличия C_t облигации определяется уравнением:
C_t=1/γ ln⁡(g(t)/(¯h (t) )),                   (11)
где
g(t)=e^∫_t^T▒〖β_s ds〗.                   (12)
¯h (t)=e^(-γF) e^(-∫_t^T▒α_s ds)-e^(-∫_t^T▒α_s ds) ∫_t^T▒〖κe^(-(R_s ) ̃F) 〗 e^(∫_s^T▒(α_u+β_u ) du) ds.       (13)
β_t=r_t λ-1/2 (μ_t-r_t )^T Σ_t^(-1) (μ_t-r_t ).                (14)
α_t=(γ-2)(μ_t^1-r_t )/(2(σ_t^1 )^2 )-(λγr_t+κ).                  (15)
Доказательство. Заменив ¯Ψ его выражением в уравнении (10), получаем:
{█(¯(h^' ) (t) 〖-(γλr_t+κ) ¯h (t)+inf┬(¯π_1 (t)∈R)〗⁡〖-((μ_t^1-r_t )γ¯π_1 (t)-1/2 (σ_t^1 )^2 ¯π_1^2 (t) γ^2 ) ¯h (t)〗=-κe^(-γ(R_t ) ̃F) g(t)@¯h (T)=e^(-γF) )┤.   (16)
По условию оптимальности первого порядка минимум достигается при:
¯π_1^⋆ (t)=((μ_t^1-r_t ))/(γ(σ_t^1 )^2 ).
И из уравнения (16) теперь можем получить:
inf┬(¯π_1 (t)∈R)⁡〖-((μ_t^1-r_t )γ¯π_1 (t)-1/2 (σ_t^1 )^2 ¯π_1^2 (t) γ^2 ) ¯h (t)〗=(2-γ)(μ_t^1-r_t )/(2(σ_t^1 )^2 ) ¯h (t).
Тогда получается следующее линейное обыкновенное дифференциальное уравнение:
{█(¯(h^' ) (t)+[(γ-2)(μ_t^1-r_t )/(2(σ_t^1 )^2 )-(λγr_t+κ)] ¯h (t)=-κe^(-γ(R_t ) ̃F) g(t)@¯h (T)=e^(-γF) )┤.
Итак, зададим:
α_t=(γ-2)(μ_t^1-r_t )/(2(σ_t^1 )^2 )-(λγr_t+κ).
Что приводит к: ¯(h^' ) (t)+α_t ¯h (t)=-κe^(-γ(R_t ) ̃F) g(t). Чья резолюция дает e^(-γF) e^(-∫_t^T▒α_s ds). Цена безразличия p облигации определяется уравнением:
¯Ψ (t,λ-C_t )=Ψ(t,λ).
Имеем:
¯Ψ (t,λ-C_t )=Ψ(t,λ)⇒-e^(-γ(λ-C_t ) ) ¯h (t)=-e^(-γλ) g(t), т.е.
-e^(-γ(λ-C_t ) ) ¯h (t)=-e^(-γλ) g(t)⇒γC_t=ln⁡(g(t)/(¯h (t) )).
Следовательно,
C_t=1/γ ln⁡(g(t)/(¯h (t) )).
В следующем разделе можем оценить непрерывную стоимость премии по КДС, которую инвестор платит продавцу защиты.
Предположим, что инвестор продает (или покупает) кредитный дефолтный своп (КДС) и получает (или платит) непрерывную премиальную ставку S(t), выплачиваемую на номинальную сумму F с момента заключения контракта до наступления срока погашения или до момента дефолта ссылочного субъекта, в зависимости от того, что произойдет раньше. Если дефолт наступает до погашения, инвестор совершает (или получает) случайный платеж (1-R)F (где 0≤R ≤1), и все будущие премиальные платежи прекращаются.
Аналогично (2) и (8), динамика богатства инвестора имеет вид:

dΛ ̃_t={█([r_t Λ ̃_t+ϵS(t)F+(μ_t^1-r_t ) π ̃_1 (t)]"d" t+π ̃_1 (t) σ_t^1 "d" B_t^1,0<t<τ,@[r_t Λ ̃_t+(μ_t^1-r_t ) π ̃_1 (t)]"d" t+π ̃_1 (t) σ_t^1 "d" B_t^1,t>τ,)┤ (17)

где предельное богатство: 〖Λ ̃_τ〗_ =Λ ̃_(τ^- )-(1-R)F⋅I_(\{τ_d≤T\}). Здесь ϵ=+1 для продавца КДС и ϵ=-1 для покупателя.
Аналогично (9) и (10), функция стоимости Ψ ̃(t,λ), соответствующая инвестициям в КДС, определяется как:

Ψ ̃(t,λ)=〖sup┬(π ̃∈R) E〗⁡[u(Λ ̃_Т )│〖Λ ̃_t〗_t=λ,t<τ_d ].                (18)
Следующее предложение устанавливает УЧП, проверяемое Ψ ̃.
Предложение 2. Функция Ψ ̃ удовлетворяет:
{█((∂Ψ ̃)/∂t (t,λ)+sup┬(π ̃∈R)⁡〖G_ϵ^π ̃ Ψ ̃(t,λ)〗=0@Ψ ̃(T,λ)=u(λ), λ∈R)┤                   (19)
где G_ϵ^π ̃ Ψ ̃(t,λ)=r_t λ (∂Ψ ̃)/∂λ (t,λ)+1/2 (σ_t^1 )^2 π ̃^2 (t) (∂^2 Ψ ̃)/(∂λ^2 ) (t,λ)+[(μ_t^1-r_t+ϵS(t)F)] π ̃(t) (∂Ψ ̃)/∂λ (t,λ)++ κ[Ψ(t,λ-ϵ(1-(R_t ) ̃ )F,z)-Ψ ̃(t,λ,z)].
Доказательство. Действуем аналогично, как в предложении 2. Достаточно заменить λ++(R_t ) ̃F на λ-ϵ(1-(R_t ) ̃ )F и ¯Ψ на Ψ ̃, и мы получаем результат.
Предположим, что функция стоимости Ψ ̃ записывается в виде:
∀t∈[0,T],Ψ ̃(t,λ)=-e^(-γλ) h ̃(t),
где h ̃:[0,T]→R_+^⋆ – функция, удовлетворяющая условию h ̃(T)=1.
Второй основной результат этой работы дает формулу для расчета ставки кредитного дефолтного свопа.
Теорема 3.
Ставка премии безразличия S(t) кредитного дефолтного свопа является решением уравнения: Ψ ̃(t,λ)=Ψ(t,λ) и это эквивалентно следующему уравнению: h ̃(t)=g(t), где:
g(t)=e^∫_t^T▒〖β_s ds〗                    (20)
h ̃(t)=e^(-γF) e^(-∫_t^T▒α_s ds)-e^(-∫_t^T▒α_s ds) ∫_t^T▒〖κe^ϵ(1-(R_s ) ̃ )F 〗 e^(∫_s^T▒(α_u+β_u ) du) ds           (21)
β_t=r_t λ-1/2 (μ_t-r_t )^T Σ_t^(-1) (μ_t-r_t )                (22)
α_t=(γ-2)(μ_t^1-r_t +ϵS(t)F)/(2(σ_t^1 )^2 )-(λγr_t+κ)                (23)
Доказательство. Оно основано по аналогии с теоремой 2. Достаточно заменить λ+(R_t ) ̃F на λ-ϵ(1-(R_t ) ̃ )F, и результат получается автоматически.

Результаты

Ниже представлены траектории рискового актива с зависящими от времени и состояния дрейфом и волатильностью случайной функции оптимального управления.

Рис. 1. Траектории рискового актива для μ(t,A_t )=μA_t;σ(t,A_t )=σA_t
Fig. 1. Trajectory of risky asset for μ(t,A_t )=μA_t;σ(t,A_t )=σA_t

Рис. 2. Функции оптимального управления для μ(t,A_t )=μA_t;σ(t,A_t )=σA_t
Fig. 2. Optimal control function for μ(t,A_t )=μA_t;σ(t,A_t )=σA_t

Рис. 3. Траектории рискового актива для μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )
Fig. 3. Trajectory of risky asset for μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )

Рис. 4. Функции оптимального управления для μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )
Fig. 4. Optimal control function for μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )

Мы представляем богатство портфеля инвестора в каждый момент времени t, значения которого зависят от вариации цен рискованных и нерискованных активов с непостоянными параметрами.

Рис. 5. Богатство портфеля инвестора для μ(t,A_t )=μA_t;σ(t,A_t )=σA_t
Fig. 5. Wealth portfolio of investor for μ(t,A_t )=μA_t;σ(t,A_t )=σA_t

Рис. 6. Богатство портфеля инвестора для μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )
Fig. 6. Wealth portfolio of investor for μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )

Мы представили выше цену безразличия корпоративной облигации, зависящую от базового актива с непостоянным коэффициентом.

Рис. 7. Контингентное требование для μ(t,A_t )=μA_t;σ(t,A_t )=σA_t
Fig. 7. Contingent claim for μ(t,A_t )=μA_t;σ(t,A_t )=σA_t

Рис. 8. Контингентное требование для μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )
Fig. 8. Contingent claim for μ(t,A_t )=μA_t;σ(t,A_t )=σ√(A_t )

Заключение

В данной работе рассмотрена оценка безразличной полезности стоимости корпоративных облигаций и премии кредитно-дефолтного свопа (CDS), которые инвестор готов принять, когда параметры модели (рыночная процентная ставка, коэффициент сноса и волатильность рискованных базовых активов) не являются постоянными и зависят от времени. В этом контексте выделены расчет оптимального портфеля инвестора и функция мгновенной стоимости каждого портфеля. Новизна данного подхода заключается в учете более реалистичных форм базовых параметров, взяв вариант моделей Блэка-Шоулза для оценки цен кредитных инструментов.
Учитывая важность для инвесторов хеджирования рисков, связанных с владением рискованными активами, будущие исследования могут рассмотреть следующие вопросы:
– как оценить цену этих кредитных инструментов в случае, когда базовый актив имеет снос и волатильность, которые зависят не только от времени, но и от другого стохастического процесса, который мы назовем «факторным процессом»;
– как оценить цену этих кредитных инструментов в случае, когда базовый актив имеет снос и волатильность, которые зависят не только от времени, но и от цепи Маркова с D состояниями.

References

1. Bellman R. On the Theory of Dynamic Pro-gramming. Proceedings of the National Academy of Sciences of the United States of America. 1952;38:316-319.

2. Zariphopoulou T. A Solution Approach to Valu-ation with Unhedgeable Risks. Finance Stochast. 2001;5:1-82.

3. Merton R. Optimum Consumption and Portfolio Rules in a Continuous-Time Model. Journal of Econom-ic Theory. 1971;3(4):373-413.

4. Sigloch G. Utility Indifference Pricing of Credit Instruments. Ph.D. The-sis. University of Toronto; 2009.

5. Henderson B. Hobson D. Real Options With Constant Relative Risk Aversion. Journal of Economic Dynamics and Control. 2002;27:329-355.

6. Hodges S., Neuberger A. Optimal Replication of Contingent Claims Under Transaction Costs. Review of Future Markets. 1989;8:222-239.

7. Lions P.L. Optimal Control of Diffusion Pro-cesses and Hamilton-Jacobi-Bellman Equations. Part 1: The Dynamic Programming Principle and Applications. Part 2: Viscosity Solutions and Uniqueness. Communi-cations in Partial Differential Equations. 1983;8:1101-1174,1229-1276.

8. Zhang Zh. Certainty Equivalent, Risk Premium and Asset Pricing. Frontiers of Business Research in China. 2010;4(2):325-339.

Submit manuscript Download PDF
Text JATS XML

To cite

Citations:

Confirmation

Регистрация