최적정지

Optimal stopping

수학에서 최적 정지[1][2] 또는 조기 정지[3] 이론은 기대 보상을 최대화하거나 기대 비용을 최소화하기 위해 특정 행동을 취할 시간을 선택하는 문제와 관련이 있다. 최적의 중지 문제는 통계, 경제수학 금융 분야(미국 옵션의 가격 책정 관련)에서 찾을 수 있다. 최적의 중단 문제의 핵심 예는 비서 문제다. 최적 정지 문제는 벨만 방정식의 형태로 쓰여질 수 있으며, 따라서 동적 프로그래밍을 사용하여 해결되는 경우가 많다.

정의

이산 시간 사례

규칙 문제를 중지하는 것은 다음 두 가지 개체와 관련이 있다.

  1. 랜덤 변수 , ,의 시퀀스로 이 변수들의 공동 분포는 알려진 것으로 가정된 것이다.
  2. 1: 랜덤 변수의 관측된 값에 따라 달라지는 일련의 'reward' 함수i ) 1{\

그러한 대상들을 감안할 때 문제는 다음과 같다.

  • 랜덤 변수의 순서를 관찰하고 있으며 각 단계 에서 관찰을 중지하거나 계속하도록 선택할 수 있음
  • 단계에서 관찰을 중단하면 y 보상을 받게 된다.
  • 예상 보상을 최대화하기 위해(또는 동등하게, 예상 손실을 최소화하기 위해) 중지 규칙을 선택하려는 경우

연속 타임 케이스

Consider a gain process defined on a filtered probability space and assume that is adapted to the filtration. 최적의 정지문제는 정지시간을 찾는 것으로 예상 이득 극대화

서 V T(를) 값함수라고 한다. 여기서 은(는) 값 을(를) 취할 수 있다

좀 더 구체적인 공식은 다음과 같다. We consider an adapted strong Markov process defined on a filtered probability space where 확률적 이 x 에서 시작되는 확률측정을 나타낸다 연속함수 에 따라 최적의 정지문제는

이것을 MLS(각각 Mayer, Lagrange, Supremeum을 의미한다) 공식이라고 부르기도 한다.[4]

솔루션 방법

최적의 정지 문제를 해결하는 데는 일반적으로 두 가지 방법이 있다.[4] 기반 프로세스(또는 이득 프로세스)가 그것의 무조건적인 유한 차원 분포에 의해 설명될 때, 적절한 해결 기법은 마팅게일 접근법인데, 마팅게일 이론을 사용하기 때문에 그렇게 불린다. 가장 중요한 개념은 스넬 봉투다. 이산 시간 사례에서 계획 지평선 디스플레이 (가) 유한하다면 동적 프로그래밍으로도 문제를 쉽게 해결할 수 있다.

기본 프로세스가 마르코프 전환 확률로 이어지는 (조건부) 전환 기능의 패밀리에 의해 결정되는 경우, 마르코프 프로세스 이론에 의해 제공되는 강력한 분석 도구를 종종 활용할 수 있으며 이러한 접근방식을 마르코프 방법이라고 한다. 해법은 보통 관련 자유경계 문제(스테판 문제)를 해결함으로써 얻는다.

점프 확산 결과

을(를) SDE가 제공한 {\레비 확산으로 한다.

where is an -dimensional Brownian motion, is an -dimensional compensated Poisson random measure, , , and are given functions such that a unique solution exists. 을(를) 오픈 세트(지급 능력 영역)로 하고

파산 때가 되다 최적의 정지 문제는 다음과 같다.

어떤 규칙성 조건에서는 다음과 같은 검증 정리가 유지되는 것으로 나타났다.[5]

함수 : {가) 충족되는 경우

  • where the continuation region is ,
  • \
  • on , where is the infinitesimal generator of

다음 ( )V ( ){\ V y S에 대한 더욱이,

  • A + =

( )= ( ) y S의 y = > 0: > D \tauy 은(는) 최적의 정지 시간이다.

또한 이러한 조건은 보다 압축적인 형태(integro-various confliction):

  • ,M- 있는 {\ {

동전던지기

(: E( ) 이 수렴되는 경우)

너는 공정한 동전을 가지고 있고 그것을 반복해서 던지고 있다. 매번 던지기 전에 던지지 않고 관찰된 평균 헤드 수를 지불(달러 단위)하도록 선택할 수 있다.

당신은 정지 규칙을 선택하여 당신이 받는 금액을 최대화하기를 원한다. Xi(i ≥ 1)가 베르누이 분포와 함께 동일한 분포의 독립 랜덤 변수의 시퀀스를 형성하는 경우

그리고 만약

그러면 시퀀스) i {i\ 1 1)이 이 문제와 관련된 개체들이다.

주택판매

(: E( i) 이 반드시 수렴되지 않는 경우)

너는 집을 가지고 있고 그것을 팔기를 원한다. 매일 당신은 당신의 집을 위해 를 제공받고, 해서 광고를 하기 위해 k 을(를) 지불한다. 당신이 당신의 집을 n일 팔면 은 y n 를 벌게 될 것이다 서 yn=( X - .

중지 규칙을 선택하여 수입을 최대화하려는 경우.

이 예에서 순서( 는 집을 위한 제의의 순서이며, 보상 기능의 순서는 얼마를 벌 것인가이다.

비서 문제

(예:() (는) 유한 시퀀스)

당신은 최고에서 최저로 순위가 매겨질 수 있는 일련의 물체들을 관찰하고 있다. 당신은 가장 좋은 물건을 고를 기회를 극대화하는 정지 규칙을 선택하기를 원한다.

Here, if (n is some large number) are the ranks of the objects, and is the chance you pick the best object if you stop intentionally rejecting objects at step i, then and 이 문제와 관련된 시퀀스 입니다. 이 문제는 1960년대 초에 몇몇 사람들에 의해 해결되었다. 비서 문제에 대한 우아한 해결책과 이 문제의 몇 가지 수정은 최적 정지(Bruss 알고리즘)의 최신 오즈 알고리즘에 의해 제공된다.

검색이론

경제학자들은 '비서의 문제'와 유사한 최적의 중지 문제를 여러 가지 연구해 왔으며, 일반적으로 이러한 분석을 '탐색 이론'이라고 부른다. 검색 이론은 특히 노동자가 고임금 일자리를 찾거나 소비자가 저가 상품을 찾는 데 초점을 맞췄다.

주차 문제

검색이론을 응용한 특별한 예로는 오페라(연극, 쇼핑 등)에 가는 운전자의 최적의 주차공간 선택 과제가 있다. 목적지에 다가가면 운전자는 주차 공간이 있는 거리를 따라 내려간다. 보통 주차장의 일부 장소만 무료다. 목표가 뚜렷이 보이므로 목표와의 거리가 쉽게 평가된다. 운전자의 과제는 이곳에서 목적지까지의 거리가 가장 짧도록 방향을 돌리지 않고 목적지에 최대한 가까운 무료 주차 공간을 선택하는 것이다.[6]

옵션거래

금융시장에 대한 옵션의 거래에서 미국옵션 보유자는 만기일 전이나 만료일에 언제든지 미리 정해진 가격으로 기초자산을 매입하거나 매도할 수 있는 권리를 행사할 수 있다. 따라서 미국 옵션의 가치평가는 본질적으로 최적의 중단문제다. 블랙-숄즈 설정을 고려하고 r 을(를) 무위험 금리로 하고 을(를) 주식의 배당률과 변동성으로 간주한다. 주가 은(는) 기하학적 브라운 모션을 따른다.

위험 중립적인 조치하에

옵션이 영구적일 때 최적의 중지 문제는

여기서 지불함수는 의 경우 ( x)=( - )+ 이고, 풋옵션의 g( )=( - )+ 이다. 변동성 불평등은

모든 ( ,) {} x\에 대해, b b은 연습 경계선이다. 해결책은 다음과 같은 것으로[7] 알려져 있다.

  • (항구적인 호출)V())){(b− K)(x/b)γ)∈(0, b)x− Kx∈는 경우 b, ∞){\displaystyle V())={\begin{경우}(b-K)(x/b)^{\gamma}&, x\in(0,b)\\x-K&, x\in는 경우에는 b,\infty)\end{경우}}}이γ =(ν 2+2r− ν)/σ{\displaystyle \gamma =({\sqrt{\nu ^{2}+2r}}-\nu)/\sigma}과ν= (r− δ
  • (Perpetual을)V())){K−)x ∈(0c](K− c)(x/c)γ일)∈(c, ∞){\displaystyle V())={\begin{경우}K-x&, x\in(0,c]\\(K-c)(x/c)^{\tilde{\gamma}}&x\in(c,\infty)\end{경우}}}이γ일)−(ν 2r 2++ν)/σ{\displaystyle{\tilde{\gamma}}=-({\sqrt{\nu ^{2.}+2r}}+\ and

한편, 유효기간이 한정되어 있을 때, 문제는 알려진 폐쇄형 해결책이 없는 2차원 자유경계 문제와 연관된다. 그러나 다양한 수치적 방법을 사용할 수 있다. 여기에서 다양한 평가 방법에 대한 블랙-숄즈 모델#아메리칸 옵션과 이산형 트리 기반 최적의 운동 시간 계산에 대한 푸짓(Pugit)을 참조하십시오.

참고 항목

참조

  1. ^ Chow, Y.S.; Robbins, H.; Siegmund, D. (1971). Great Expectations: The Theory of Optimal Stopping. Boston: Houghton Mifflin.
  2. ^ Ferguson, Thomas S. (2007). Optimal Stopping and Applications. UCLA.
  3. ^ Hill, Theodore P. (2009). "Knowing When to Stop". American Scientist. 97: 126–133. doi:10.1511/2009.77.126. ISSN 1545-2786 – via (For French translation, see cover story in the July issue of Pour la Science (2009)). {{cite journal}}: 외부 링크 위치 via= (도움말)
  4. ^ a b Peskir, Goran; Shiryaev, Albert (2006). "Optimal Stopping and Free-Boundary Problems" (PDF). Lectures in Mathematics. ETH Zürich. doi:10.1007/978-3-7643-7390-0. ISBN 978-3-7643-2419-3. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  5. ^ Øksendal, B.; Sulem, A. (2007). "Applied Stochastic Control of Jump Diffusions". doi:10.1007/978-3-540-69826-5. ISBN 978-3-540-69825-8. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  6. ^ MacQueen, J.; Miller Jr., R.G. (1960). "Optimal persistence policies". Operations Research. 8 (3): 362–380. doi:10.1287/opre.8.3.362. ISSN 0030-364X.
  7. ^ Karatzas, Ioannis; Shreve, Steven E. (1998). "Methods of Mathematical Finance". Stochastic Modelling and Applied Probability. 39. doi:10.1007/b98840. ISBN 978-0-387-94839-3. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)