유클리드 거리 행렬
Euclidean distance matrix수학에서, 유클리드 거리 행렬은 유클리드 공간의 n개 점 집합의 간격을 나타내는 n×n 행렬이다.k차원 공간 δ의k , x, (\},에 대해 유클리드 거리 행렬 A의 요소는 그 사이의 거리의 제곱으로 주어진다.그것은
(꼭 유클리드라고는 할 수 없는) 거리 행렬의 맥락에서 엔트리는 일반적으로 정사각형이 아닌 거리로 직접 정의된다.그러나, 유클리드 사례에서, 거리의 제곱은 제곱근 계산을 피하고 관련 이론과 알고리즘을 단순화하기 위해 사용된다.
유클리드 거리 행렬은 그램 행렬과 밀접하게 관련되어 있다.후자는 선형대수의 방법을 사용하여 쉽게 분석됩니다.이를 통해 유클리드 거리 행렬을 특성화하고 이를 실현하는 x ,, {\},},\ 을 복구할 수 있습니다.실현이 존재하는 경우, 유클리드 공간의 거리 보존 변환(회전, 반사, 변환)과 같은 견고한 변환까지 유일하다.
실제 적용에서 거리는 노이즈가 많은 측정치이거나 임의의 차이점 추정치(메트릭이 반드시 필요한 것은 아님)에서 비롯됩니다.목표는 거리 행렬이 가능한 한 주어진 차이 행렬에 가까운 유클리드 공간의 점으로 이러한 데이터를 시각화하는 것일 수 있습니다. 이를 다차원 스케일링이라고 합니다.또는, 유클리드 공간의 점으로 이미 표현된 두 세트의 데이터가 주어진다면, 사람들은 그것들이 얼마나 비슷한 모양인지, 즉 거리 보존 변환에 의해 얼마나 밀접하게 관련될 수 있는지 물어볼 수 있다. 이것이 프로크러스테스 분석이다.거리 중 일부는 누락되거나 레이블이 지정되지 않은 상태(매트릭스 대신 순서 없는 집합 또는 다중 집합)로 표시될 수 있으며, 이로 인해 그래프 실현 문제 또는 턴파이크 문제(선상의 [1][2]점)와 같은 보다 복잡한 알고리즘 작업이 발생할 수 있습니다.
특성.
유클리드 거리가 미터법이라는 사실에 의해 행렬 A는 다음과 같은 성질을 가진다.
- A의 대각선상의 모든 원소는 0(즉, 중공 매트릭스)이므로 A의 트레이스는 0입니다.
- A는 대칭입니다(, {}=ji
- i j + a k j( { _ { } ) \ ( \ displayrt{ _ { } ) + { \ { _ { } } ( triangle 부등식 )
차원 k에서, 유클리드 거리 행렬은 k+2 이하의 순위를 가진다., 2, 포인트가 일반 위치에 있는 경우 순위는 정확히 min(n, k + 2)입니다.
거리는 다른 유클리드 거리 행렬을 얻기 위해 어떤 거듭제곱으로도 축소될 수 있다.즉, A ( ) { A = ( _ { } )이 유클리드 거리 행렬이라면 ( ) { { a _ { ij는 모든 0<s < [3]1에 대한 유클리드 거리 행렬이다.
그램 행렬과의 관계
k차원 공간 is의k x, 2, n {\1},의 그램 행렬은 점곱의 n×n G ( j { G=( { style이라고 생각됨
- j i x i display x display x j cosdisplaydisplay display 、 \ { i } = \ {\ \ 。서\ style \ }는x 의 각도입니다.
특히
- ‖ 2 { { { i } = \ _ { } ^ {} 、 i 0 0 0 0 g of of g 。
따라서 그램 매트릭스는 (0 ~ )1, x, n(\},2},\n의 기준과 각도를 나타냅니다.
X X를 ,을 열로 하는 k×n 매트릭스로 .그리고나서
- T { G = { \ { } X 。 i j { i j } = x _ { i }^{ \ { } _ { } ( ) 。
X X로 분해할 수 있는 행렬, 즉 X의 열)의 그램 행렬은 정확히 양의 반정의 행렬이다.
유클리드 거리 행렬과 그램 행렬을 관련시키려면, 다음을 관찰하십시오.
즉, 규범과 각도가 거리를 결정합니다.Gram 매트릭스에는 0으로부터의 거리라는 추가 정보가 포함되어 있습니다.
반대로 n+1 쌍 0, 1, ({},n}) 의 에 따라 n - (1 i in n ) 사이의 도트 곱이 결정됩니다.
(이것은 편광 아이덴티티라고 불립니다).
특성화
n×n 행렬 A의 경우, k차원 유클리드 공간 δ에서k 1},},\의 시퀀스는 A가 유클리드 거리 행렬인 경우 δ에서의k A의 실현이라고 한다.일반성을 잃지 않고 1 스타일 }=\이라고 가정할 수 있다(- 1 스타일 })로 변환하면 거리가 유지되기 때문이다).
정리[4](Schoenberg 기준,[5] Young & Hougholder에[6] 의해 독립적으로 제시됨) — 실제 엔트리가 있는 대칭 중공 n×n 행렬 A는 (n-1)×() 행렬 G ( i) , { G=(, le의 경우에만 에서의k 실현을 허용한다.
이는 G가 최대 k개의 포지티브 등급이기 때문에 앞에서 설명한 바와 같다. G는 G X 로 분해될 수 있는 경우에만 k개의 포지티브 등급이기 때문이다. 여기서 X는 k×n [7]행렬이다.게다가 X열은 δ로k 실현된다.따라서 G를 분해하는 모든 방법을 통해 실현을 찾을 수 있습니다.두 가지 주요 접근법은 콜레스키 분해의 변형 또는 스펙트럼 분해를 사용하여 G의 주요 제곱근을 구하는 것이다.확정행렬#분해 참조.
정리문은 첫 번째 1을 구별합니다.같은 정리의 보다 대칭적인 변종은 다음과 같습니다.
결과[8] - 실제 엔트리가 있는 대칭형 중공 n×n 행렬 A는 A가 H { ∈ : 0} { H = \ { v\ in \ { R } { } \ ^ { }} { 0 、 A }인 경우에만 실현을 허용합니다.
- T v { v^ { \ style v^ { } \0 } ( v R \ v \ \{ ^ { n^ { } ) { \ stextstyle _ 1 = 1 n }^{ } }} )
다른 특성화에는 케일리-맹거 행렬식이 포함된다.특히 대칭 중공 n×n 행렬은 모든 (k+3)×(k+3) 주요 서브매트릭스가 존재하는 경우에만 실현k 가능하다는 것을 나타낼 수 있다.즉, 모든 k+3점이 [9]동일한 경우에만 최종 다수의 점에 대한 반미터가 등각적으로 δ에k 포함된다.
실제로, 정의도 또는 순위 조건은 수치 오차, 측정 소음 또는 실제 유클리드 거리에서 도달하지 못한 데이터로 인해 실패할 수 있습니다.최적으로 유사한 거리를 실현하는 포인트는 단수값 분해 또는 반무한 프로그래밍과 같은 선형 대수 도구를 사용하여 반무한 근사(및 원한다면 낮은 순위 근사)에 의해 찾을 수 있다.이를 다차원 스케일링이라고 합니다.이러한 방법의 변형은 불완전한 거리 데이터도 처리할 수 있습니다.
라벨이 부착되지 않은 데이터, 즉 특정 쌍에 할당되지 않은 거리의 집합 또는 다중 집합은 처리하기가 훨씬 더 어렵다.예를 들어, 이러한 데이터는 DNA 염기서열 분석(특히 부분 소화에서 게놈 복구) 또는 위상 검색에서 발생합니다.거리의 다중 집합이 동일한 두 점 집합을 갖는 경우(강체 변환과 반드시 관련이 있는 것은 아님) 두 점 집합을 호모메트릭이라고 합니다.n(n-1)/2 거리의 주어진 멀티셋이 주어진 차원 k에서 실현될 수 있는지 여부를 결정하는 것은 매우 어려운 일이다.한 차원에서는 이것이 턴파이크 문제로 알려져 있으며, 다항식 시간 내에 해결될 수 있을지는 미해결 문제이다.거리의 멀티셋이 오차 막대로 지정되면 1차원 케이스도 NP-hard가 됩니다.그럼에도 불구하고, 실제 알고리즘은 많은 경우에 존재한다. 예를 들어 랜덤 포인트.[10][11][12]
표현의 고유성
유클리드 거리 행렬이 주어졌을 때, 그것을 실현하는 점의 순서는 강성 변환까지 유일하다 – 이것들은 유클리드 공간의 등각성입니다: 회전, 반사, 변환 및 그 구성.[1]
정리 - x, 2, n {\}, 및 y, 2, {\},를 k차원 유클리드 공간 δ의k 2개의 점으로 합니다.거리k x - j ( \ \ _ { } - _ { } \ 및} - ( ( \ _ { i } - y _ { j } \ 는 (모든 1 ji, jnn )에서 로의 고정 변환이 존재하는 경우에만 동일합니다.
증명 |
---|
견고한 변환은 거리를 유지하므로 한 방향이 명확합니다.거리「 - x 와 「 - 가 같다고 합니다.일반성을 잃지 않고 점을 각각 - 1({ })과 y 1로변환하여 1 1 }= 으로 할 수 있습니다.(n-1)×(n-1) 그램 은 나머지 i x - 1({display }=}-1})은 의 그램 행렬과 동일하다., X X Y {\ X입니다. 여기서 X와 Y는 각 벡터를 열로 포함하는 k×(n-1) 행렬입니다.이는 직교 k×k 행렬 Q가 존재함을 의미하며, QX=Y는 유한 대칭 행렬 #유니터리 변환까지의 고유성을 참조한다.Q는 0 ~0를 및 0에 δk(변환 없이 회전과 반사로 이루어진 구성)의 직교 변환을 나타냅니다.최종 강성 변환은 T - 1) + 1({ T)=로 합니다. |
응용 프로그램에서 거리가 정확하게 일치하지 않는 경우 Procrustes 분석은 보통 특이값 분해를 사용하여 견고한 변환을 통해 두 점 집합을 최대한 가깝게 관련짓는 것을 목표로 합니다.일반적인 유클리드 사례는 직교 프로크루스테스 문제 또는 와바 문제로 알려져 있다. (다양한 불확실성을 설명하기 위해 관측치에 가중치를 부여할 때)응용 예로는 인공위성의 방향 결정, 분자 구조 비교(화학), 단백질 구조(생물 정보학에서의 구조 정렬) 또는 뼈 구조(생물학에서의 통계적 형상 분석)가 포함된다.
「 」를 참조해 주세요.
- 인접 행렬
- 코프라네리티
- 거리 형상
- 중공 행렬
- 거리 행렬
- 유클리드 랜덤 행렬
- 유클리드 거리 행렬에 의해 임의의 차분 행렬을 근사하는 시각화 기술인 고전적인 다차원 스케일링
- 케일리-멘거 행렬식
- 반무한 매립
메모들
- ^ a b 독매닉 외 (2015년)
- ^ (2007년)
- ^ Maehara, Hiroshi (2013). "Euclidean embeddings of finite metric spaces". Discrete Mathematics. 313 (23): 2848–2856. doi:10.1016/j.disc.2013.08.029. ISSN 0012-365X. 정리 2.6
- ^ 그래서 (2007), 정리 3.3.1, 페이지 40
- ^ Schoenberg, I. J. (1935). "Remarks to Maurice Fréchet's Article "Sur La Definition Axiomatique D'Une Classe D'Espace Distances Vectoriellement Applicable Sur L'Espace De Hilbert"". Annals of Mathematics. 36 (3): 724–732. doi:10.2307/1968654. ISSN 0003-486X. JSTOR 1968654.
- ^ Young, Gale; Householder, A. S. (1938-03-01). "Discussion of a set of points in terms of their mutual distances". Psychometrika. 3 (1): 19–22. doi:10.1007/BF02287916. ISSN 1860-0980. S2CID 122400126.
- ^ (2007), 정리 2.2.1, 페이지 10
- ^ 따라서 (2007), 결과 3.3.3, 페이지 42
- ^ Menger, Karl (1931). "New Foundation of Euclidean Geometry". American Journal of Mathematics. 53 (4): 721–745. doi:10.2307/2371222. JSTOR 2371222.
- ^ Lemke, Paul; Skiena, Steven S.; Smith, Warren D. (2003). "Reconstructing Sets From Interpoint Distances". In Aronov, Boris; Basu, Saugata; Pach, János; Sharir, Micha (eds.). Discrete and Computational Geometry. Vol. 25. Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 597–631. doi:10.1007/978-3-642-55566-4_27. ISBN 978-3-642-62442-1.
- ^ Huang, Shuai; Dokmanić, Ivan (2020). "Reconstructing Point Sets from Distance Distributions". arXiv:1804.02465 [cs.DS].
- ^ Jaganathan, Kishore; Hassibi, Babak (2012). "Reconstruction of Integers from Pairwise Distances". arXiv:1212.2386 [cs.DM].
레퍼런스
- Dokmanic, Ivan; Parhizkar, Reza; Ranieri, Juri; Vetterli, Martin (2015). "Euclidean Distance Matrices: Essential theory, algorithms, and applications". IEEE Signal Processing Magazine. 32 (6): 12–30. arXiv:1502.07541. doi:10.1109/MSP.2015.2398954. ISSN 1558-0792. S2CID 8603398.
- James E. Gentle (2007). Matrix Algebra: Theory, Computations, and Applications in Statistics. Springer-Verlag. p. 299. ISBN 978-0-387-70872-0.
- So, Anthony Man-Cho (2007). A Semidefinite Programming Approach to the Graph Realization Problem: Theory, Applications and Extensions (PDF) (PhD).
- Liberti, Leo; Lavor, Carlile; Maculan, Nelson; Mucherino, Antonio (2014). "Euclidean Distance Geometry and Applications". SIAM Review. 56 (1): 3–69. arXiv:1205.0349. doi:10.1137/120875909. ISSN 0036-1445. S2CID 15472897.
- Alfakih, Abdo Y. (2018). Euclidean Distance Matrices and Their Applications in Rigidity Theory. Cham: Springer International Publishing. doi:10.1007/978-3-319-97846-8. ISBN 978-3-319-97845-1.