거울 강하

Mirror descent

수학에서 미러 강하미분 가능한 함수의 국소 최소값을 찾기 위한 반복 최적화 알고리즘이다.

경사 강하 및 승수 가중치와 같은 알고리즘을 일반화한다.

역사

거울 강하법은 1983년 [1]네미로프스키와 유딘에 의해 처음 제안되었다.

동기

미분 가능 F {\F에 적용되는 구배 강하에서는 로컬 {\ F x 0 {\ \ _0}으로 시작하여 0, , 2, \ _ {을 고려합니다.은(는)

(일정한 학습률 유지)

우리는 단조로운 시퀀스를 가지고 있다.

따라서 시퀀스( n) {(가) 원하는 로컬 최소값으로 수렴되기를 바랍니다.

이는 다음과 같은 점에 주목함으로써 재구성할 수 있다.

, x + { style \ } { _ { \ { { } { - \ { }^{ n } 에서 F 에 대한 근사를 최소화합니다.

이 유클리드 거리 항은 브레그만 거리의 특별한 예이다.다른 Bregman 거리를 사용하면 특정 [2][3]지오메트리의 최적화에 더 적합한 Hedge와 같은 다른 알고리즘이 생성됩니다.

공식화

볼록 K n\ K \ \} ^ { } { { given optimize optimize optimize given {{ { 、 n { { { { { {{ { { {{ { { { { { { we we { { { { { { { { { { { { { { {

또한 주어진 노름에 대해 미분 가능한 볼록 h : {\ h \ {\ -display 볼록함수가 주어진다.이를 거리 생성 함수라고 하며, 그 구배h : n \ \h \ dispect \ { ^{ \ 미러 맵이라고 합니다.

미러 내림차순의 각 반복에서 첫 x 0 (\}\K부터 시작합니다.

  • 이중 공간에 매핑: t ( t) { _ { } \ left \ h ( x { ) }
  • 그라데이션 스텝을 사용하여 듀얼 공간에서 갱신합니다. t + t - t ( xt ) \ \ { t + 1 } \ _ { t } - \ _ { t } \ { _ { } } } } }
  • 원래 공간에 매핑: t + (h) -1 ( t + x 화살표 h _
  • 가능한 K K + x ( x + 1) ) \ x _ + \ \ { x \ K } x{1 투영합니다. 서 D는 {styleftyledisplay_+1}입니다.

내선번호

온라인 최적화 설정의 미러 강하를 온라인 미러 강하(OMD)[4]라고 합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 아르카디 네미로프스키와 데이비드 유딘입니다문제의 복잡성과 최적화의 방법 효율성.John Wiley & Sons, 1983년
  2. ^ Nemirovski, Arkadi(2012) 튜토리얼: 대규모 결정론적 및 확률적 볼록 최적화를 위한 미러 강하 알고리즘.https://www2.isye.gatech.edu/~nemirovs/COLT2012Tut.pdf
  3. ^ "Mirror descent algorithm". tlienart.github.io. Retrieved 2022-07-10.
  4. ^ Fang, Huang; Harvey, Nicholas J. A.; Portella, Victor S.; Friedlander, Michael P. (2021-09-03). "Online mirror descent and dual averaging: keeping pace in the dynamic case". arXiv:2006.02585 [cs.LG].