탄성지도

Elastic map
유방암 마이크로 어레이 데이터의 시각화를 위한 선형 PCA 대 비선형 주 다지관[1]: a) 3D PCA 선형 다지관의 노드와 2D 주 표면 구성.데이터 집합은 곡선 형태여서 2D 주 평면에서 적절하게 매핑될 수 없다. b) 내부 2D 비선형 주 표면 좌표(ELMap2D)의 분포와 점의 밀도 추정, c) b)와 동일하지만 선형 2D PCA 다지관(PCA2D)의 경우."기본" 유방암 하위형은 ELMap2D로 보다 적절하게 시각화되며, PCA2D에 비해 분포의 일부 특징이 더 잘 해결된다.주요 다지관은 탄성 지도 알고리즘에 의해 생성된다.데이터는 공개 경쟁에 이용할 수 있다.[2]소프트웨어는 무료 비상업적 사용을 위해 이용할 수 있다.[3][4]

탄성 맵비선형 치수 감소를 위한 도구를 제공한다.그들의 구축에 의해, 그것들은 데이터 공간에 내장되어 있는 탄성 스프링의 시스템이다.[1]이 시스템은 저차원 다지관에 가깝다.이 시스템의 탄성 계수는 완전히 구조화되지 않은 k-평균 군집화(탄성 제로)에서 선형 PCA 다지관(높은 굽힘 및 낮은 스트레칭 모듈용)에 가까운 위치에 있는 추정기로의 전환을 허용한다.탄성계수의 중간값으로 이 시스템은 효과적으로 비선형 주 매니폴드에 근사치를 한다.이 접근방식은 데이터 분포의 "중간"을 통과하는 주요 다지관과 탄성막 및 판 사이의 기계적 유추에 기초한다.이 방법은 A.N.고르반, A.Y. 지노비예프, A.A.에 의해 개발되었다.1996-1998년 피텐코

탄성지도의 에너지

을(를) 유한 차원 유클리드 공간에 데이터 집합으로 한다.탄성 맵은 동일한 공간에 w 의 노드 집합으로 표현된다.각 데이터포인트 에는 호스트 노드, 즉 가 있다(가장 가까운 노드가 여러 개 있는 경우 가장 작은 수의 노드를 차지한다).데이터 세트 (는) 등급 j={은(는)

근사 에너지 D는 왜곡이다.

= j= s - - w j 2

즉, 각 데이터 지점을 호스트 노드와 연결하는 유닛 탄성을 가진 스프링의 에너지.예를 들어 데이터 지점 { i 의 하위 집합에 대한 확률 밀도 함수표준 편차를 반영하기 위해 이 합계에 가중 요인을 적용할 수 있다

노드 집합에서는 추가 구조가 정의된다.일부 노드 쌍 i, j) 탄성 에지로 연결된다.의 E{\을(를) 호출하십시오 노드 몇 개( w ) 구부러지는 리브를 형성한다. 세 쌍둥이 G {\ G을(를) 호출하십시오

The stretching energy is ,
The bending energy is ,

여기서 (는) 각각 스트레칭과 벤딩 모듈리다.스트레칭에너지는 이라고 부르기도 하고, 벤딩에너지는 얇은 판형 용어로 부르기도 한다.[5]

예를 들어, 2D 직사각형 그리드에서 탄성 가장자리는 수직 및 수평 가장자리(가장 가까운 정점의 쌍)에 불과하며, 벤딩 리브는 연속(가장 근접한) 정점의 수직 또는 수평 세 쌍이다.

탄성 지도의 총 에너지는 U= + U + .

노드{ 의 위치는 탄성 지도의 기계적 평형에 의해 결정된다. 즉, 그 위치는 전체 에너지 를 최소화할 수 있는 위치다

기대 최대화 알고리즘

클래스 있는 데이터 집합 S{\{\ {의 주어진 분할에 대해, 2차 U {\U}의 최소화는 계수의 희박한 행렬과 함께 선형 문제가 된다따라서 주성분 분석 또는 k-평균과 마찬가지로 분할 방법이 사용된다.

  • 주어진{ {\\{{\대해 { j {\j ;
  • 주어진 에 대해 U 최소화하고 ;
  • 변경 사항이 없으면 종료하십시오.

이 기대 최대화 알고리즘 의 국소 최소값을 보장한다 근사치 개선을 위해 다양한 추가 방법을 제안한다.예를 들어, 연화 전략을 사용한다.이 전략은 견고한 그리드(작은 길이, 작은 벤딩 및 대형 탄성 모듈 } 및 로 시작하여 소프트 그리드(작은 })로 마무리한다.그 훈련은 몇 시대로 진행되는데, 각 시대는 그 자체의 격자 경직성을 가지고 있다.또 다른 적응 전략으로는 적은 수의 노드에서 시작하여 점차 새로운 노드를 추가하는 순 성장 전략이다.각 시대는 자체적인 노드 수와 일치한다.

적용들

탄성 지도법에 의한 주곡선의 적용 :[6] 비선형 삶의 질 지수포인트는 1인당 총생산량, 기대수명, 유아사망률, 결핵발생률 등 4가지 지표의 가치로 형성된 4차원 공간에서 유엔 171개국의 데이터를 나타낸다.다른 형태와 색깔은 다양한 지리적 위치와 연도에 해당한다.빨간색 굵은 선은 데이터 집합에 가까운 주 곡선을 나타낸다.

메서드와 자유 software[3]의 가장 중요한 응용 프로그램은 다차원 데이터의 탐색 자료 분석과 조직에 bioinformatics[7][8]에, 경제학 데이터 조직, 정치적 sciences,[9]지리적 정보 시스템에 데이터 매핑에 대한 보조 도구와 다양한 것을 데이터의 조직으로 사회를 위한 것이다.자연.

이 방법은 밝은 현미경 이미지 더미에서 나무 잎의 곡면을 재구성하기 위한 정량적 생물학에서 적용된다.[10]이 재구성은 삼차체의 지오데틱 거리와 패터닝 사이의 지오데틱 거리를 정량화하는 데 사용되는데, 이것은 병원체에 저항하는 식물의 능력을 나타내는 표시다.

최근에는 금융 포트폴리오의 선정, 최적화, 관리의 기초가 되는 의사결정 과정에서 지원 툴로서 이 방법을 채택하고 있다.[11]

탄력 지도 방법은 파이프 내 기체-액체 흐름의 흐름 체계의 식별에 적용되는 문제에 대해 몇 가지 기계 학습 방법과 체계적으로 시험하고 비교하였다.[12]다양한 정권이 있다.단상 물 또는 공기 흐름, 거품기 흐름, 거품기 흐름, 슬러그 흐름, 슬러그-흔들 흐름, 처른 흐름, 추간기 흐름, 환형기 흐름.흐름 체계를 식별하기 위해 사용되는 가장 간단하고 일반적인 방법은 시각적 관찰이다.그러나 이 접근방식은 상대적으로 높은 가스와 액체 흐름 속도에 주관적이고 적합하지 않다.따라서 기계학습법은 많은 저자에 의해 제안되고 있다.이 방법은 보정 프로세스 중에 수집된 차압 데이터에 적용된다.탄력지도 방식은 각 정권의 영역이 대표되는 2D지도를 제공했다.다른 기계 학습 방법과의 비교는 다양한 파이프 지름과 압력에 대해 표 1에 제시되어 있다.

표 1. 유동체 식별 정확도(%)
서로 다른 기계 학습 알고리즘의
눈금 매기기 테스트 더 큰 지름 높은 압력
탄성지도 100 98.2 100 100
99.1 89.2 76.2 70.5
SVM 100 88.5 61.7 70.5
SOM(작음) 94.9 94.2 83.6 88.6
SOM(대형) 100 94.6 82.1 84.1

여기서, ANN은 백프로포메이션 인공신경망을, SVM은 서포트 벡터 머신을, SOM은 자기조직 지도를 나타낸다.하이브리드 기술은 엔지니어링 애플리케이션을 위해 개발되었다.[13] 기술에서 탄성 은 주성분 분석(PCA), 독립성분 분석(ICA), 백프로포메이션 ANN과 함께 사용된다.

교과서는[14] 탄력지도와 자기조직지도(SOM)를 경제·재정적 의사결정에 적용하면서 체계적으로 비교하는 내용을 담고 있다.

참조

  1. ^ a b A. N. Gorban, A. Y. Zinovyev, 주요 그래프다지관, In: 기계 학습 애플리케이션 및 동향에 대한 연구 핸드북:알고리즘, 방법 및 기술, 올리바스 E.S 등Eds. Information Science Reference, IGI Global:허쉬, 미국, 2009년 28-59
  2. ^ 왕, Y, Klijn, J.G, 장, 시우워츠, A.M, Look, M.P., 양, F., 탈란토프, D., Timmermans, M.M.Meijer-van Gelder, M.E, Yu, J. 외:림프절 음성 1차 유방암의 원격 전이를 예측하는 유전자 표현 프로파일.Lancet 365, 671–679(2005);데이터 온라인
  3. ^ a b A. Zinovyev, ViDaExpert - 다차원 데이터 시각화 도구(비상업용 무료)파리 퀴리 연구소.
  4. ^ A. Zinovyev, ViDaExpert 개요, IHES(Institut des Hautes Etudes Scientifique), Bures-Sur-Yebet, Ale-de-France.
  5. ^ 마이클 카스, 앤드류 위트킨, 데메트리 테르조풀로스, 뱀:활성 윤곽선 모델, Int.J. Computer Vision, 1988 volume 1-4 pp.321-331
  6. ^ A. N. Gorban, A. Zinovyev, 주요 다지관실제 그래프: 분자 생물학에서 동적 시스템에 이르기까지, 국제 신경 시스템 저널, 20권, 3호(2010) 219–232.
  7. ^ A.N. 고반, B. 케글, D.Wunsch, A. Zinovyev(에드), 데이터 시각화 치수 축소를 위한 주요 다지관, LNCSE 58, Springer: 베를린 – 하이델베르크 – 2007년 뉴욕. ISBN978-3-540-73749-0
  8. ^ M. Chacón, M. Lévano, H. Allende, H. Nowak, Detection of Gene Expressions in Microarrays by Applying Iteratively Elastic Neural Net, In: B. Beliczynski et al. (Eds.), Lecture Notes in Computer Sciences, Vol. 4432, Springer: Berlin – Heidelberg 2007, 355–363.
  9. ^ A. 지노비예프, 정치사회과학의 데이터 시각화, In: SAGE "국제정치학 백과사전", Badie, B, Berg-Schlosser, D, Morliono, L. A. (Eds.), 2011.
  10. ^ H. Failmezger, B. Jaegle, A.슈레이더, M. 뮐스캄프, A.Tresch, 반자동 3D 재구성 밝은 현미경 영상의 트리콤 패터닝 분석, PLoS Computing Biology, 2013, 9(4):e1003029.
  11. ^ M. Resta, 탄력적 지도를 통한 포트폴리오 최적화: 이탈리아 증권 거래소 지식 기반 인텔리전트 정보 및 엔지니어링 시스템 B에서 나온가지 증거.아폴로니, R.J. 하울렛과 L. 자인(eds), 컴퓨터 과학 강의 노트, 제4693권, 스프링어: 베를린 – 하이델베르크, 2010년, 635-641년.
  12. ^ H. 샤반, S. 타불라리스, 차압 신호와 탄성 지도를 이용한 수직상향 공기-수관 흐름에서의 흐름 체계의 확인, 국제 다중 효소 흐름 61 (2014) 62-72.
  13. ^ H. 샤반, S. 타불라리스, 차압 신호에 기계 학습 기법을 적용하여 2상 파이프가스액체 유량의 측정, 국제 다중 효소 흐름 저널 67(2014), 106-117
  14. ^ M. Resta, 경제금융 의사결정에서 컴퓨터 인텔리전스 패러다임, 시리즈 인텔리전트 시스템 참조 라이브러리, 제99권 스프링어 국제 출판, 2016 스위스.