커널 힐버트 공간 재현

Reproducing kernel Hilbert space
그림은 RKHS 시청에 관련되지만 다양한 접근 방식을 보여준다.

함수 분석(수학의 한 분야)에서 재현 커널 힐버트 공간(RKHS)은 점 평가가 연속적인 선형 함수인 함수의 힐버트 공간이다.Roughly speaking, this means that if two functions and in the RKHS are close in norm, i.e., is small, then and are also pointwise close, i.e., 은(는) 모든 에 대해 작다그 반대는 사실일 필요가 없다.null

RKHS가 아닌 함수의 힐버트 공간을 구축하는 것은 전적으로 간단하지 않다.[1]그러나 몇 가지 예가 발견되었다.[2][3]null

참고로 기능(및 그에 따르지 않RKHSs)의 L2공간이 아닌 힐베르트 공간이 아니라 기능의 동등 클래스의 힐베르트 공간==1Q{\displaystyle g())=1_{\mathbb{Q}())}0{\displaystyle f())=0}과 g(예를 들어, 그 기능 f{f\displaystyle}과 입수{\displaystyle g}f에 의해 정의되())}. (L2)로 동일하다.단, 대역제한 함수의2 공간과 같이 표준이 L-orm인 RKHS가 있다(아래 예 참조).null

RKHS는 함수가 정의된 세트의 x에 대해 " 에서 평가는 커널에 의해 결정된 함수로 내부 제품을 취함으로써 수행될 수 있다는 점에서 공간의 모든 함수를 재현하는 커널과 연관된다.그러한 재생성 커널은 모든 평가 기능이 연속적인 경우에만 존재한다.null

재생성 커널은 1907년 스타니스와프 자렘바조화생화 함수경계문제에 관한 연구에서 처음 소개되었다.제임스 머서적분 방정식 이론에서 재생 특성을 만족시키는 기능을 동시에 검토했다.재생 알맹이 아이디어는 가보르 스제기, 스테판 버그만, 살로몬 보치너의 논문에 실릴 때까지 20년 가까이 손대지 않았다.이 주제는 결국 1950년대 초 나흐만 아론자인과 스테판 버그먼에 의해 체계적으로 전개되었다.[4]null

이 공간들은 복잡한 분석, 조화 분석, 양자역학을 포함한 넓은 응용을 가지고 있다.경험적 위험 기능을 최소화하는 RKHS의 모든 기능을 훈련 지점에서 평가한 커널 함수의 선형 조합으로 작성할 수 있다는 유명한 대표자 정리 때문에 커널 힐버트 공간을 재현하는 것은 통계 학습 이론 분야에서 특히 중요하다.이는 경험적 위험 최소화 문제를 무한 치수에서 유한 치수 최적화 문제로 효과적으로 단순화하므로 실질적으로 유용한 결과물이다.null

이해하기 쉽도록, 우리는 실제 가치의 힐버트 공간에 대한 틀을 제공한다.이 이론은 복잡한 가치 함수의 공간으로 쉽게 확장될 수 있으므로 분석 함수의 공간인 커널 힐버트 공간을 재현하는 많은 중요한 예를 포함한다.[5]null

정의

을(를) 임의 집합으로 H H을(를) 실제함수Hilbert 공간으로 하며 포인트 추가 및 포인트 스칼라 곱을 장착한다.함수 의 Hilbert 공간에 대한 평가 기능은 각 점 x {\ x에서 평가하는 선형 기능이다

We say that H is a reproducing kernel Hilbert space if, for all in , is continuous at any in or, equivalently, if is a bounded operator on 즉, 과 같은 M > 이(가) 있다.

(1)

<< }은는) x X에 대해 가정하지만 = x}}일 수도 있다

속성(1)은 도메인의 모든 지점에서 내부 제품의 존재와 의 모든 기능에 대한 평가를 모두 보장하는 가장 약한 조건이지만, 실제로는 쉬운 적용에 도움이 되지 않는다.RKHS의 보다 직관적인 정의는 이 속성이 에서 x{\를 가진 f 의 내부 제품을 취함으로써 평가 기능을 나타낼 수 있음을 보장할 수 있다는 것을 관찰함으로써 얻을 수 있다 이 함수는 이른바 재생산 커널이다.RKHS가 이름을 딴 Hilbert H 좀 더 공식적으로, Riesz 표현 정리 X의 모든 에 대해 재현 고유한 요소 가 존재함을 암시한다.

(2)

Since is itself a function defined on with values in the field (or in the case of complex Hilbert spaces) and as is in we have that

여기서 K y }}과) 연관된 H 의 요소다.

이를 통해 의 재현 커널을 K: → R 로서 정의할 수 있다.

이 정의에서 : → R X X\또는 복잡한 경우 이 대칭(resp. condition symmetric)이고 양정확하다는 것을 쉽게 알 수 있다.

어떤 n∈ N, x1,… 들어,)n∈ X및 c1,…, cn∈ R.{\displaystylen\in \mathbb{N},x_{1},\dots ,x_{n}\in X,{\text{과}}.}반대 이것에 대하[6]그 Moore–Aronszajn 정리(아래 참조)일종:함수 K{K\displaystyle}가 이런 조건들이 그때 th,c_{n}\in \mathbb{R}c_{1},\dots.의 전에 에 있는 함수의 Hilbert 공간이며, 이 공간은 재생성 커널이다.null

밴드제한 연속함수 의 공간은 현재 우리가 알 수 있듯이 RKHS이다.공식적으로 일부 컷오프 주파수 0을 수정하고 힐버트 공간을 정의하십시오.

where is the set of continuous functions, and is the Fourier transform of . As the inner product of this Hilbert space, we use = -() )⋅ g (x ) d f^{2

푸리에 역전 정리로부터, 우리는

그 다음, 에 대해 Cauchy-Schwarz Plancherrel의 정리를 따른다

이러한 불평등은 평가 기능이 제한되어 있음을 보여주며, (가) 실제로 RKHS임을 증명한다.

이 경우 커널 함수 는 다음과 같이 주어진다.

이를 확인하기 위해 먼저 위에서 정의한 ( ) 의 푸리에 변환이 다음에서 제공된다는 점에 주목한다.

그것은 푸리에 변환의 시간 변화 속성의 결과물이다.결과적으로, 플랑쉐렐의 정리를 이용하여,

따라서 우리는 커널의 재생 특성을 얻는다.null

이 경우 Dirac 델타 함수의 "대역제한 버전"이며 컷오프 주파수 이() 무한대로의 경향이 있으므로 K x( ) K_는 약한 의미에서 y- )로 수렴한다는 점에 유의한다.null

무어-아론자엔 정리

우리는 재생성 커널 힐버트 공간이 대칭적이고 양적인 확연한 재생 커널 함수를 어떻게 정의하는지 보아왔다.무어-아론자엔의 정리는 다른 방향으로 간다; 그것은 모든 대칭적이고 긍정적인 한정된 커널이 힐버트 공간을 재현하는 독특한 커널 공간을 정의한다고 말한다.이 정리는 비록 E. H. 무어 탓으로 돌렸지만, 아론자진(Aronszajn)의 '커널 재생산 이론'에 처음 등장했다.null

정리.K가 집합 X에서 대칭적이고 양의 한정된 커널이라고 가정하자.그리고 X에는 K가 재생성 커널인 함수의 독특한 힐버트 공간이 있다.

증명. X의 모든 X대해x K = K(x, ⋅)를 정의하십시오. H0 {Kx : x ∈ X}의 선형 스팬으로 설정하십시오.다음0 기준으로 H에 내부 제품 정의

, ( x,) = , y H 0 K_{K_{오른쪽0}}}}}}}}을(를) 암시한다이 내면의 생산물의 대칭은 K의 대칭에서 따르며 비기생성은 K가 양적으로 확정되어 있다는 사실에서 따르게 된다.null

이 내부 제품에 관해서 HH0 완성이 되게 하라. 다음 H는 형태의 함수로 구성된다.

이제 재생 속성(2):

고유성을 증명하기 위해 GK가 재생성 커널인 함수의 또 다른 힐버트 공간이 되게 한다.Xxy에 대해 (2)는 다음을 함축한다.

By linearity, on the span of . Then because G is complete and contains H0 and hence contains its completion.null

이제 우리는 G의 모든 요소가 H에 있다는 것을 증명해야 . f 는 G의 요소가 되게 하라. HG의 닫힌 하위 공간이기 때문에 f= f + f 를 쓸 수 있다. 여기서 x X이면 KGH:의 재생성 커널이기 때문에.

여기서 는 K H에 속한다는 사실을 사용하였고, 그 내부는 f 가 포함되도록 하였다.G H은(는) 0이다. =f G에 H(를) 넣고 증빙을 마무리한다.null

적분 연산자와 머서의 정리

Mercer의 정리를 사용하여 적분 연산자를 통해 대칭 양정확정 K 을 특성화하고 RKHS의 추가 보기를 얻을 수 있다. 은(는) 엄격히 양의 유한 보렐 측정 (와) : X\time X { 연속적이고 대칭적이며 양의 한정된 함수를 갖춘 콤팩트 공간이다.적분 연산자 : ( X) 2( ) X)\}(X

여기서 L ( ) 에 대한 사각 통합 기능의 공간이다

Mercer의 정리에서는 적분 연산자 의 스펙트럼 분해는 K}의 고유값 및 고유특성에 있어 K의 직렬 표현을 산출한다고 명시하고 있다따라서 는 K{\}이(가) 이러한 고유값과 고유특성의 관점에서 해당 RKHS를 정의할 수 있도록 재현된 커널임을 의미한다.우리는 아래에 세부사항을 제공한다.null

이러한 가정 하에서 은(는) 소형, 연속형, 자기 적응형, 양성 연산자다.The spectral theorem for self-adjoint operators implies that there is an at most countable decreasing sequence such that and 는{ϕ 나는}{\displaystyle\와 같이{\phi_{나는}\}}. TK의 확실함으로써 L2(X){\displaystyle L_{2}(X)}의 정규직 교기로부터 좀\phi _ᆬ())=\sigma _{나는}\phi _ᆮ())},, 나입니다.;0}일 경우 모두에게.{\displaystyle i.}또는 TK{\d을 보여 줄 수 있0{\displaystyle T_{K},\sigma _{나는}> σ.isplay 은(는) C( X C의 공간에 연속적으로 매핑되므로, 우리는 연속함수를 모든 고유 벡터로 선택할. 그렇다면 머서의 정리 K K는 다음과 같이 고유값과 연속적인 고유특성의 관점에서 쓰여질 수 있다.

모든 , X x X 대해 다음과 같은 경우

위의 시리즈 표현은 의 Mercer 커널 또는 Mercer 표현이라고 한다

또한 RKHS 이(가) 다음과 같이 제공됨을 알 수 있다.

서 H 내부 제품은

RKHS의 이러한 표현은 확률적 프로세스와 커널 PCA에 대한 카루넨-로브 표현과 같은 확률과 통계에 응용된다.null

피쳐 맵

형상 지도는 지도 : 이며여기서 F는 형상 공간이라고 부를 Hilbert 공간이다.첫 번째 절에서는 경계/연속 평가 기능, 양의 확정 기능 및 적분 연산자 사이의 연결을 제시했으며, 본 절에서는 형상 지도 측면에서 RKHS의 또 다른 표현을 제공한다.null

먼저 모든 형상 맵이 다음 명령을 통해 커널을 정의한다는 점에 주목한다.

(3)

분명히 (는) 대칭이며 양의 F {\ F의 내부 제품 속성에서 따온 것이다 반대로 모든 양의 한정 함수와 그에 상응하는 재현 커널 힐버트 공간은 (3)이 보유하고 있는 것과 같은 관련 형상 맵이 무한히 많다.null

예를 들어, 우리는 모든 = H ( = 사소한 것으로 취하면, 그 재생성 속성에 의해 (3)이 충족된다형상도의 또 다른 고전적인 로는F = 2{\}} () =( i () i{\ \(}}}}pi _{를 취함으로써 적분 연산자에 관한 이전 절과 관련된다..

이러한 커널과 피쳐 맵 사이의 연결은 우리에게 인 확정 함수를 이해하고 따라서 커널을 H 의 내부 제품으로 재현하는 새로운 방법을 제공한다 더욱이 모든 피쳐 맵은 당연히 양의 확정 함수의 정의에 의해 RKHS를 정의할 수 있다.null

마지막으로 피쳐 맵을 통해 RKHS에 대한 또 다른 관점을 보여주는 기능 공간을 구성할 수 있다.선형 공간 고려

우리는 {\에 대한 표준을 정의할 수 있다.

It can be shown that is a RKHS with kernel defined by . This representation implies that the elements of the Reproducing Kernel are inner products of elements in the feature space.RKHS에 대한 이러한 견해는 머신러닝의 커널 트릭과 관련이 있다.[7]null

특성.

RKHS의 다음 특성은 독자들에게 유용할 수 있다.null

  • Let be a sequence of sets and be a collection of corresponding positive definite functions on 그런 다음 그 뒤를 따른다.
    = × . X_
  • , 그러면 (를) 0 에 대한 제한도 재생산 커널이다.
  • 된 커널 을(를) 고려하십시오(예: 모든 x 대해 )= 1 K,xX에 대한 유사 메트릭을 다음과 같이 정의하십시오.
    카우치-슈워즈 불평등에 의해
    이러한 불평등은 을(를) 입력 간 유사성의 척도로 볼 수 있게 한다., X x() 비슷하면 ( x, y) 이(가) 1에 가깝고, , X 이()와 다를 경우 가 0에 가까워진다
  • X의 스팬 닫힘은 과(와) 일치한다[8]

일반적인 예

바이린린 커널

The RKHS corresponding to this kernel is the dual space, consisting of functions satisfying .

다항식 커널

방사상 기준 함수 커널

( , )= K ( - y 를 만족시키는 또 다른 흔한 종류의 커널이다 몇 가지 예는 다음과 같다.

  • 가우스 또는 제곱 지수 커널:
  • 라플라시안 커널:
    이 커널을 사용하는 RKHS 에서 f 함수의 제곱 표준은 다음과 같다.[9]
    2= ( ) x + f ( x) \

버그만 커널

우리는 또한 버그만 커널의 예를 제공한다.X를 유한하게 하고 H를 X의 모든 복합값 함수로 구성하도록 한다.그러면 H의 요소는 복잡한 숫자의 배열로 나타낼 수 있다.통상적인 내부 제품을 사용한다면 Kx 다른 모든 곳에서 x와 0의 값이 1인 함수로, , ) 는 이후부터 ID 매트릭스로 생각할 수 있다.

이 경우 H 에 대해 이형성이 있다

= X의 경우(D {\ {D은(는) 단위 디스크를 의미한다)가 더 정교하다.Here the Bergman space is the space of square-integrable holomorphic functions on . It can be shown that the reproducing kernel for is

마지막으로 대역폭 (를) 사용하는 L () L)에서 밴드 제한 함수의 공간은 커널을 재현하는 RKHS이다.

벡터 값 함수에 대한 확장

이 섹션에서는 다중 작업 학습다지관 정규화에 특히 중요한 확장인 벡터 값 함수의 공간으로 RKHS의 정의를 확장한다.The main difference is that the reproducing kernel is a symmetric function that is now a positive semi-definite matrix for any in . More formally, we define a vector-valued RKHS (vvRKHS) as a Hilbert space of functions 모든 R {\ X 에 대해 displaystyle x\}

, 그리고

이 두 번째 속성은 스칼라 값을 매긴 케이스의 재생 속성과 유사하다.이 정의는 스칼라 값 RKHS에서 보았던 대로 적분 연산자, 경계 평가 기능 및 형상 지도에도 연결될 수 있다는 점에 주목한다.우리는 vvRKHS를 한정된 평가 기능을 가진 벡터 값 힐버트 공간으로 동등하게 정의할 수 있으며, 이것이 리에즈 표현 정리에 의한 고유한 재생산 커널의 존재를 함축하고 있음을 보여줄 수 있다.또한 Mercer의 정리는 벡터 값 설정을 다루기 위해 확장될 수 있으며, 따라서 vvRKHS의 형상 지도 뷰를 얻을 수 있다.마지막으로 { x : X, x\^{T의 스칼라 값 사례와 유사한 또 다른인 H{\}과 일치한다는 사실도 확인할 수 있다.null

이러한 공간에 대한 구성 요소별 관점을 취함으로써 vvRKHS에 대한 직관력을 얻을 수 있다.특히 모든 vvRKHS는 특정 입력 공간에 있는 스칼라 값 RKHS에 대해 등축적으로 이형성이라는 것을 알게 되었다.={ , X × {\ 공간과 그에 하는 재생산 커널을 고려하십시오.

(4)

As noted above, the RKHS associated to this reproducing kernel is given by the closure of the span of where for every set of p방송 (,) ,( y, ) × × × ×× X\

스칼라 값 RKHS와의 연결은 모든 매트릭스 값 커널을 (4)를 통해 알 수 있다는 사실에 의해 이루어질 수 있다.

더욱이 (4)의 형태를 가진 모든 커널은 위의 식을 가진 매트릭스 값 커널을 정의한다.이제 지도 : }\ H_은(는) 다음과 같이 정의된다.

where is the component of the canonical basis for , one can show that is bijective and an isometry between and .

vvRKHS에 대한 이러한 관점은 다중 작업 학습에 유용할 수 있지만, 이 등위계는 벡터 값 사례 연구를 스칼라 값 사례의 연구로 줄이지 않는다.실제로 이 등계법 절차는 원래 커널의 속성이 상실되는 경우가 많기 때문에 스칼라 값 커널과 입력 공간 모두를 실제 작업하기에는 너무 어렵게 만들 수 있다.[10][11][12]null

매트릭스 값 재현 커널의 중요한 클래스는 가능한 커널로, 스칼라 값 커널과 T -차원 대칭 양의 반확정성 매트릭스의 산물로 고려될 수 있다.우리의 이전 논의에 비추어 볼 때 이 알맹이는 형식이다.

X x , y {\ displaystyle t, {\t에 대해. 스칼라 값을 매트릭스 값을 매긴 커널이 입력 간의 종속성을 암호화할 때 입력값과 출력 사이의 종속성을 암호화하는 것을 관찰할 수 있다.null

우리는 마지막으로 위의 이론이 기능공간에 값이 있는 함수의 공간으로 더 확장될 수 있다고 말하지만, 이러한 공간에 대한 커널을 얻는 것은 더 어려운 과제다.[13]null


RKHS와 ReLU 함수의 연결

함수는 일반적으로 ( x)= (, x) 로 정의되며, 활성화 함수로 사용되는 신경망 구조에서 주축이다.커널 힐버트 공간 재생산 이론을 이용해 ReLU와 같은 비선형 함수를 구성할 수 있다.아래에서는 이 구조를 도출하고 그것이 어떻게 ReLU 활성화를 통한 신경망의 표현력을 내포하는지 보여준다.null

We will work with the Hilbert space of absolutely continuous functions with and square integrable (i.e. ) derivative.그것은 내적인 제품을 가지고 있다.

재생 커널을 구성하기 위해서는 밀집된 하위 공간을 고려하는 것으로 충분하므로 f 1[ ,) ()= f (이(가)가 되도록 한다 그러면 미적분의 기본 정리를 제공한다.

어디에

( x)= G( , ), ( 0)= null

이것은 = (, ) {\(를 재현한다는 것을 의미한다.

제한 를) 취함으로써 우리는 ReLU 기능을 얻는다.

이 제형을 사용하면 RKHS에 대표자 정리를 적용하여 신경망 설정에서 ReLU 활성화를 사용하는 것의 최적성을 증명할 수 있다.[citation needed]null

참고 항목

메모들

  1. ^ 알페이, D, T. M. 밀스."알맹이 힐버트 공간을 재생산하지 않는 힐버트 공간의 가족."J. AntonAppl. 1.2(2003): 107–111.
  2. ^ Z. Pasternak-Winiarski, 국제수학과학저널 버그만 타입의 재생성 알맹이를 인정하는 가중치, 제15권, 제1호, 1992년호.null
  3. ^ T. WW. a다, ˙ 현대 수학 분석 저널 (Armenian Academy of Science) Szeg¨o 타입의 재생성 알맹이를 인정하는 가중치 55, 2020.null
  4. ^ 오쿠트무스투르
  5. ^ 폴슨
  6. ^ 더렛
  7. ^ 로사스코
  8. ^ 로사스코
  9. ^ 베를리넷, 알랭, 토마스, 크리스틴.Kluwer Academic Publishers, 2004, 확률과 통계커널 힐버트 공간 재현
  10. ^ 드 비토
  11. ^
  12. ^ 알바레즈
  13. ^ 로사스코

참조

  • 알바레즈, 마우리시오, 로사스코, 로렌조와 로렌스, 닐, "벡터-값 함수를 위한 커널: a Review," 2011년 6월.
  • Aronszajn, Nachman (1950). "Theory of Reproducing Kernels". Transactions of the American Mathematical Society. 68 (3): 337–404. doi:10.1090/S0002-9947-1950-0051437-7. JSTOR 1990404. MR 0051437.
  • 베를리넷, 알랭, 토마스, 크리스틴.Kluwer Academic Publishers, 2004년 확률과 통계에서 커널 힐버트 공간을 재현.
  • Cucker, Felipe; Smale, Steve (2002). "On the Mathematical Foundations of Learning". Bulletin of the American Mathematical Society. 39 (1): 1–49. doi:10.1090/S0273-0979-01-00923-5. MR 1864085.
  • 데 비토, 어니스트, 우마니타, 베로니카, 실비아 빌라."벡터 값 측정 가능한 커널에 대한 머서 정리의 확장," arXiv:1110.4017, 2013년 6월.
  • Durret, Greg. 9.107 과정 노트, 매사추세츠 공과대학교, https://www.mit.edu/~9.1987/118e-notes/class03_gduret.pdf, 2010년 2월.
  • Kimeldorf, George; Wahba, Grace (1971). "Some results on Tchebycheffian Spline Functions" (PDF). Journal of Mathematical Analysis and Applications. 33 (1): 82–95. doi:10.1016/0022-247X(71)90184-3. MR 0290013.
  • 오쿠트무스투르, 바버.2005년 8월 빌켄트 대학의 M.S. 논문 "커널 힐버트 스페이스 재현".
  • 폴슨, 번"커널 힐버트 공간 재생산 이론 소개", http://www.math.uh.edu/~번/rkhs.pdf.
  • Steinwart, Ingo; Scovel, Clint (2012). "Mercer's theorem on general domains: On the interaction between measures, kernels, and RKHSs". Constr. Approx. 35 (3): 363–417. doi:10.1007/s00365-012-9153-3. MR 2914365.
  • 로사스코, 로렌초, 포조, 토마스"기계학습 정규화 투어 – MIT 9.520 강의 노트" 원고, 2014년 12월.
  • Wahba, Grace, Spline Models for Observational Data, SIAM, 1990.
  • Zhang, Haizhang; Xu, Yuesheng; Zhang, Qinghui (2012). "Refinement of Operator-valued Reproducing Kernels" (PDF). Journal of Machine Learning Research. 13: 91–136.