양확정 커널

Positive-definite kernel

수학의 한 분야인 연산자 이론에서 양-확정성 커널양-확정성 함수 또는 양-확정성 행렬의 일반화다.통합 연산자 방정식을 푸는 맥락에서 20세기 초 제임스 머서가 처음 도입했다.그 이후 수학의 다양한 부분에서 긍정-확정 함수와 그 다양한 유사점과 일반화가 생겨났다.그것들은 푸리에 분석, 확률 이론, 운영자 이론, 복잡한 함수 이론, 순간 문제, 적분 방정식, 부분 미분 방정식경계문제, 기계 학습, 내장 문제, 정보 이론 및 기타 영역에서 자연적으로 발생한다.

이 글에서는 실용적 응용을 고려하기 전에 일반적인 사상과 속성부터 시작하여 양정적 알맹이 이론의 역사적, 현재의 전개에 대해 논할 것이다.

정의

을(를) 비어 있지 않은 집합으로 두십시오(때로는 인덱스 집합이라고도 함).대칭함수 : to \mathb{R}}}\mathb {X 대한 양성 정의(p 커널이라고 한다.

holds for any , given .

확률론에서, 때때로 (.)의 균등이 c = ( i) 을 내포하고, 이 조건을 부과하지 않는 양의 반확정(p.s.d.) 커널을 구별한다.이는 페어웨이즈 평가에 의해 생성된 행렬 = K(x i ,x ) Kx_},가 완전히 양의(p.d) 또는 음의(p.d)의 고유값을 갖도록 요구하는 것과 동등하다는 점에 유의하십시오.

수학적 문헌에서, 커널은 대개 복합적으로 가치 있는 함수들이지만, 이 글에서 우리는 p.d. 커널의 응용에서 일반적인 관행인 실제 가치 함수를 가정한다.

일부 일반 속성

  • p.d. 커널제품군( i N, :X X →R {\{\mathb
    • i= K \sum 1, \ _\n}\ 0
    • 제품 … K n 은(는) 1…을 p.d이고, N ,},
    • 한계 = K 는 한계가 존재하는 경우 p.d이다.
  • If is a sequence of sets, and a sequence of p.d. kernels, then both
and
= = X × n
  • Let . Then the restriction of to is also a p.d. kernel.

p.d. 커널의 예

  • 유클리드 공간 에 정의된 p.d. 커널의 일반적인 예는 다음과 같다.
    • Linear kernel: .
    • Polynomial kernel: .
    • Gaussian kernel (RBF kernel): .
    • Laplacian kernel: .
    • 아벨 커널: ( , )= - x- y, x , y R ,> 알파
    • kernel generating Sobolev spaces : , where is the Bessel 제3종의 기능
    • Paley-Wiener 공간을 생성하는 커널: ( , )= ( ( - y), x, , > 0 (x-y x
  • (가 Hilbert 공간이라면 해당 내부 제품 ( ,,) : H H (는) p.d. 커널이다.정말, 우리는 가지고 있다.
  • + d 표시 및 히스토그램에 정의된 커널:히스토그램은 실제 문제 적용에서 자주 접하게 된다.대부분의 관측치는 보통 계수의 비음성 벡터의 형태로 사용할 수 있으며, 정상화될 경우 주파수의 히스토그램을 산출한다.각 Jensen difference, -square, Total Differency 및 Helinger distance의 두 가지 변형인 제곱 메트릭스 제품군이 나타났다.

다음 공식을 사용하여 p.d. 커널을 정의할 수 있다.

역사

(1.1)에서 정의한 바와 같이 양정확정 알맹이는 제임스 머서의 적분 방정식에 관한 논문에서 1909년에 처음 나타났다.[2]몇 명의 다른 저자들은 그 후 20년 동안 이 개념을 사용했지만, 중 누구도 명시적으로 K(,) = f( - y) 즉 p.d 함수(사실 M)를 사용하지 않았다.마티아스와 S. 보치너는 p.d. 낟알의 연구를 모르고 있었던 것 같다.머서의 연구는 1904년 힐베르트의 제2종류의 프레드홀름 적분 방정식에 관한 논문에서 비롯되었다.

특히 힐버트는 그런 모습을 보여 주었었다.

여기서 (는) 연속 실제 대칭 커널이고, (는) 연속적이고,{ 는)의 해당 고유값이다.Hilbert는 "확실한" 커널을 이중 적분을 위한 커널로 정의했다.

힐베르트의 로 분명한을 특징짓는 것이 너무 제한적이어서 결정요인의 관점에서 특징짓는 것이 너무 제한적이라는 것을 머서는 곧 알게 되었다He therefore defined a continuous real symmetric kernel to be of positive type (i.e. positive-definite) if for all real continuous functions on , and he proved that (1.1) is a necessary and su커널이 양의 유형인 경우 ffffficient 조건.그리고 나서 Mercer는 어떤 지속적인 p.d. 커널에 대해서도 확장이 가능하다는 것을 증명했다.

절대적이고 균일하게 보유한다.

거의 동시에 적분 방정식 이론의 다른 물음에 의해 동기 [4]부여된 W. H. Young은 연속 커널 조건(.1)의 경우, x L [a, 에 대해 ( x) [\0과 동등하다는 것을 보여주었다

E.H. 무어는 매우 일반적인 종류의 p.d. 커널에 대한 연구를 시작했다.If is an abstract set, he calls functions defined on “positive Hermitian matrices” if they satisfy (1.1) for all . Moore was interested in generalization of integral equations and showed that 에는 각 H, ( y)=( f, (, y)Hilbert 공간 K 이 속성은 커널의 재현 속성이라고 하며 타원형 부분 미분 방정식의 경계 값 문제 해결에서 중요성이 있는 것으로 판명되었다.

p.d. 낟알이 큰 역할을 한 또 하나의 발전 선은 1929년 E. Cartan에 의해 시작되었고, H에 의해 지속된 동질적 공간에 대한 조화 이론이었다. Weyl과 S.이토. 동질적 공간에서 p.d. 낟알에 대한 가장 포괄적인 이론은 특수한 경우로서 p.d.함수에 대한 작업과 지역적 콤팩트 집단의 불가해한 단일적 표현을 포함하는 m.크레인[7] 이론이다.

확률론에서 p.d. 커널은 확률적 과정의 공분산 커널로 발생한다.[8]

커널 Hilbert 공간 및 피쳐 맵 재현을 통한 연결

긍정적이고 확실한 커널은 기본적인 힐버트 공간 구조를 포함하는 프레임워크를 제공한다.다음에서 우리는 긍정적이고 확실한 커널과 두 가지 수학적인 물체, 즉 힐버트 공간과 피쳐 맵을 재현하는 밀접한 관계를 제시한다.

을(를) 집합으로 하고, {\함수 : → R {( ,) : H 에 해당하는 내부 제품 모든 X에 대한 평가 e: 는) ( f)= ( ) 에 의해 정의된다 먼저 재생산 커널 힐버트 공간(RKHS)을 정의한다.

정의: 스페이스 는 평가 기능이 연속적인 경우 재생성 커널 힐버트 공간이라고 한다.

모든 RKHS에는 그것과 관련된 특별한 기능, 즉 재생 커널이 있다.

정의:재현 커널은 다음과 같은 : X 함수다.

1) x ( ) , X H X
2)( , )= ( ) 모든 x x X.

후자의 성질은 재생성 성질이라고 한다.

다음 결과는 RKHS와 재생 커널 사이의 동등성을 보여준다.

정리:모든 재생산 커널 은 고유한 RKHS를 유도하며, 모든 RKHS는 고유한 재생산 커널을 가지고 있다.

이제 양성정확한 커널과 RKHS 사이의 연결은 다음과 같은 정리에 의해 주어진다.

정리:모든 재생산 커널은 양-확정성이며, 모든 양성 확정 커널은 고유한 RKHS를 정의하며, 그 중 고유한 재생산 커널이다.

따라서 확실한 양의 K 를) 제공하면 과(와) 연관된 RKHS를 재생 커널로 구축할 수 있다.

앞에서 말한 바와 같이 양정확정 커널은 내부 제품에서 구성될 수 있다.이 사실은 p.d. 커널을 머신러닝 애플리케이션에서 발생하는 또 다른 흥미로운 개체, 즉 피쳐 맵과 연결하는 데 사용될 수 있다. (를) Hilbert 으로 하고 ( ,f )F {\(\,\F}} 해당 내부 제품을 사용한다.임의의 지도 : → F 피쳐 맵이라고 불린다.이 경우 을(를) 형상 공간이라고 부른다.모든 피쳐 맵이 고유한 p.d. 커널을 정의하고 있음을 쉽게 알 수 있다.

실제로 의 명확한 정의는 내부 제품의 p.d. 속성에서 따온 것이다.반면에, 모든 p.d. 커널과 그에 상응하는 RKHS는 많은 관련 피쳐 맵을 가지고 있다.For example: Let , and for all . Then 복제 속성별이는 적절한 힐버트 공간의 내부 제품으로서 p.d. 커널을 새로운 시각으로 바라보거나, 다른 말로 하면 p.d. 커널을 유사성 지도로 볼 수 있다는 것을 암시하는데, 는 두 지점 {\ x 가 K, 를 통해 얼마나 유사한지를 효과적으로 수치화하는 것이다 게다가,p.d. 커널과 그에 상응하는 RKHS의 등가성, 모든 형상도를 RKHS를 구성하는 데 사용할 수 있다.

커널과 거리

커널 방법은 흔히 가장 가까운 이웃과 같은 거리 기반 방법과 비교된다.이 섹션에서는 커널 거리 과 같은 두 개별 성분 간의 유사성에 대해 논의한다

여기서 일부 세트 의 각 요소 쌍 사이의 거리 함수에 의해 우리는 해당 집합에 정의된 메트릭, 즉 X × mathcal}\ 음수 값이 아닌 함수 d 을 의미한다.

  • ( , ) 0 d ) = {\인 경우에만,x = x
  • ( , )= ( y, )
  • ( x, ) d( , y)+ ( , )

거리와 p.d. 커널 사이의 하나의 링크는 음의 확정 커널이라고 불리는 특정한 종류의 커널에 의해 주어지며, 다음과 같이 정의된다.

정의: : × → R{\{R\mathb X{\에서 음정(n.d.) 커널이라고 한다.

holds for any and such that .

n.d. 알갱이와 거리 사이의 평행 다음에 집합{(x)):x ∈ X}{\displaystyle\와 같이{(x,x):x\in{\mathcal{X}엘 때마다 n.d. 커널 조로와}년}}, 및 X{\displaystyle{{X\mathcal}}만 이 세트에 경우에만 0입니다, 그 다음에 제곱 근은 거리}각 거리 했던 것과 같은 당시 .[10] 있구는tco반드시 n.d. 커널에 반응한다.이것은 힐베르트 거리에만 해당되며, 거리 스타일 은(는) 미터법 공간, d) 디스플레이 스타일을 힐베르트 공간에 등축적으로 내장할 수 있는 경우 힐베르트 거리에만 해당된다.

반면에, n.d. 커널은 무한히 분리할 수 있는 커널로 알려진 p.d. 커널의 하위 패밀리와 구별될 수 있다.음수 값이 아닌 K 은(는) 마다 K=( n Kn 양의 정의가 무한히 분할될 수 있다고 한다.

또 다른 링크는 p.. 유사계수를 유도하는 것인데, 거리 함수의 첫 번째 제약조건이 y y d( x, y)= 을 허용하기 위해 느슨하게 된다 양수정의 K{\ 거리 함수를 다음과 같이 정의할 수 있다.

일부 응용 프로그램

기계학습의 커널

RKHS의 모든 미니마이저 함수가 트레인에서 평가된 커널 함수의 선형 조합으로 기록될 수 있다는 유명한 대표자 정리 때문에, 양정확정 커널은, 힐버트 공간을 재생산하는 커널과의 동등성을 통해, 통계 학습 이론 분야에서 특히 중요하다.g 포인트이는 경험적 위험 최소화 문제를 무한 치수에서 유한 치수 최적화 문제로 효과적으로 단순화하므로 실질적으로 유용한 결과물이다.

확률론적 모델의 커널

확률론에서 커널이 발생하는 방법에는 여러 가지가 있다.

  • 비결정적 복구 문제: 쌍 샘플i ,)= ( , ( x, f 의 경우 집합 X f}의 새 지점 에서 알 수 없는 모델 함수 응답 (}을 찾기를 원한다고 가정해 보십시오관찰이나 실험에 의해 주어지는 에서 응답 i 의 고정된 함수가 아니라 실제 값 랜덤 변수 ) Z의 실현이다목적은 결정론적 설정에서 f 을(를 대체하는 E[ Z( x_{i에 대한 정보를 얻는 것이다.For two elements the random variables and will not be uncorrelated, because if is too close to the random experiments described by ) 은(는) 유사한 동작을 보이는 경우가 많다.이것은 공분산 K(x ,) = [ ( ) Z( ) Z에 의해 설명된다 그러한 커널은 존재하며 약한 추가 가정 하에서 양립성이 확실하다.이제 확률론적 배경을 완전히 무시한 채 공분산 커널과 함께 커널 보간법을 사용하여 ( ) 에 대한 좋은 추정치를 얻을 수 있다.

평균과 분산이 0인 노이즈 변수 {\이(가 x 인 노이즈 변수가 x 에 추가되었다고 가정해 보십시오 그러면 노이즈가 해당 X x}에 대해 독립적이며 Z에 대해 독립적이라고 가정해 보십시오.g a good estimate for is identical to the above one, but with a modified kernel given by .

  • 커널별 밀도 추정:문제는 도메인 에 대한 다변량 분포의 f ) 큰 표본 X ,…, x n_1},\에서 복구하는 것이다.샘플링 포인트가 밀집되어 있는 경우, 참 밀도 함수는 큰 값을 가져야 한다.그리드의 각 셀에 있는 표본의 수를 세고, 결과 히스토그램을 표시하면 단순한 밀도 추정치가 가능하며, 이는 조각으로 일정한 밀도 추정치를 산출한다.총 적분량이 1인 비음성 변환 불변 커널 K를 사용하여 더 나은 추정치를 얻을 수 있으며, 이를 정의한다.

어림짐작으로

부분 미분방정식의 수치해석

소위 메쉬프리 방법의 가장 큰 적용 영역 중 하나는 PDE의 수치적 해법에 있다.인기 있는 메쉬프리 방법 중 일부는 양의 결정성 커널(메쉬리스 로컬 Petrov Galerkin(MLPG), 재현 커널 입자법(RKPM), 평활입자 수역학(SPH)과 밀접하게 관련되어 있다.이 방법들은 결합을 위해 방사상 기반 커널을 사용한다.[11]

스틴스프링확장정리

기타 응용 프로그램

컴퓨터 실험과 기타 공학 실험에 관한 문헌에서, p.d. 커널, RBF 또는 크리그링에 기초한 모델들과 점점 더 마주치게 된다.그러한 주제 중 하나는 반응 표면 방법론이다.데이터 피팅으로 요약되는 다른 유형의 애플리케이션으로는 신속한 시제품 제작과 컴퓨터 그래픽이 있다.여기서는 종종 점 구름 데이터를 근사하게 또는 보간하기 위해 암묵적 표면 모델을 사용한다.

수학의 다른 다양한 분야에서 p.d. 커널의 적용은 다변량 통합, 다변량 최적화, 수치 분석 및 과학 컴퓨팅에 있으며, 여기서 한 사람이 고성능 컴퓨팅 환경에서 이상적으로 구현된 빠르고 정확하며 적응적인 알고리즘을 연구한다.[13]

참고 항목

참조

  1. ^ 하인, M, 부스케, O. (2005)"확률 측정에 대한 힐베르트 지표와 긍정적인 확정 커널"Ghahramani, Z.와 Cowell, R.에서 편집자, Processions of AISTATS 2005.
  2. ^ 머서, J. (1909)"양과 음의 기능 및 적분 방정식 이론과의 연관성"런던 왕립 협회의 철학적 거래 시리즈 A 209, 페이지 415-446.
  3. ^ 힐버트, D. (1904)."그룬쯔게 아이너 알게마이넨 테오리 데 라이나렌 일체형글리쿤겐 1세", 고트Nachrichten, math.-phys. K1(1904), 페이지 49-91.
  4. ^ 영, W. H. (1909)"대칭함수의 종류와 적분 방정식 이론에서 요구되는 정리에 관한 노트"라고 필로스는 말했다.트랜스 로이Soc. London, Ser. A. 209, 페이지 415-446.
  5. ^ E.H. 무어(1916)."적절하게 긍정적인 에르미타인의 행렬에 대해," 불.아머. 수학.Soc. 23, 59, 페이지 66-67.
  6. ^ 무어, E.H. (1935년)"일반 분석, 1부", 회고록 아머.필로스.필라델피아 1번 소쿠리.
  7. ^ 크레인. M(1949/1950)."동질 공간 I과 II에 대한 헤르미티아 양성 커널"(러시아어), 우크라이나.Mat. Z. 1(1949), 페이지 64-98 및 페이지 2(1950), 페이지 10-59.영어 번역:아머. 수학.Soc. 번역서 2, 34 (1963), 페이지 69-164.
  8. ^ 로에브, M. (1960년)"확률론" 2부, 반 노스트랜드, 프린스턴, N.J.
  9. ^ 로사스코, L.와 포조, T.(2015년)."기계학습 정규화 투어 - MIT 9.520 강의 노트" 원고.
  10. ^ Berg, C, Christensen, J. P. R, Resel, P. (1984년)"Semigroups에 대한 Harmonic Analysis".Springer Verlag 수학 대학원 교과 100위.
  11. ^ 샤박, R. 그리고 웬들랜드, H. (2006)."커널 테크닉:머신러닝에서 메쉬리스 방법에 이르기까지", 캠브리지 대학 출판부, Acta Numeria(2006), 페이지 1-97.
  12. ^ 할랜드, B., Qian, P. Z. G. (2010)"대규모 컴퓨터 실험을 위한 정확한 에뮬레이터," 앤.통계학.
  13. ^ 구메로프, N. A., Duraiswami, R. (2007)"사전 정의된 Krylov 반복을 통한 고속 방사상 기준 함수 보간"SIAM J. 사이언톨로지.계산 29/5, 페이지 1876-1899.