화산도(통계)

Volcano plot (statistics)
대사 데이터를 보여주는 화산 그림.빨간색 화살표는 큰 규모의 접이식 변화(x축)와 높은 통계적 유의성(-p10 값, y축)을 모두 표시하는 관심 지점을 나타낸다.빨간색 점선은 p = 0.05이며, 선 위의 점은 p < 0.05이고 선 아래의 점은 p > 0.05이다.이 그림은 2(로그 = 12) 미만의 접이식 변화를 갖는 점이 회색으로 표시되도록 색상으로 표시된다.

통계에서 화산도는 반복 데이터로 구성된 대용량 데이터 세트의 변화를 신속하게 식별하는 데 사용되는 산점도의 한 유형이다.[1]각각 y축과 x축에 유의성 대 접힘 변화를 표시한다.이러한 그림들은 유전체학, 단백질학, 대사학과 같은 전지적 실험에서 점점 더 흔해지고 있다. 두 조건 사이에 종종 수천 개의 반복 데이터 지점의 목록을 가지고 있고 가장 의미 있는 변화를 빨리 식별하고자 하는 사람도 있다.화산도는 통계적 시험의 통계적 유의성 측정(: 분산 분석 모델의 p 값)과 변화의 크기를 결합하여 통계적으로 유의한 큰 규모의 변화를 표시하는 데이터 포인트(gen 등)를 신속하게 시각적으로 식별할 수 있다.

화산도는 y축에 p 값의 음수 로그(보통 base 10)를 표시하여 생성된다.따라서 p 값이 낮은 데이터 점(매우 유의함)이 그림의 상단을 향해 나타나게 된다.x축은 두 조건 사이의 접이식 변화의 로그다.접이식 변화의 로그는 양방향의 변화가 중심에서 등거리처럼 보이도록 사용된다.이러한 방식으로 점을 표시하면 그림에서 두 가지 관심 영역, 즉 그림의 맨 위를 향해 발견되는 점들이 왼쪽 또는 오른쪽에서 멀리 떨어져 있다.이는 큰 폭의 접이식 변화(중심의 왼쪽 또는 오른쪽)와 높은 통계적 유의성(상단을 향해 있음)을 나타내는 값을 나타낸다.

3차원의 데이터(신호 강도 등)에 따라 점을 색칠하면 추가 정보를 추가할 수 있지만, 이는 균일하게 채택되지 않는다.화산도는 또한 정규화의 예인 미세조영(SAM) 유전자 선택 기준의 유의성 분석을 그래픽으로 표시하기 위해 사용된다.[2]

화산도의 개념은 다른 용도에 일반화될 수 있는데, 여기서 x축은 통계 신호의 강도 측도와 관련되고 y축신호의 통계적 유의성의 측도와 관련된다.예를 들어 게놈 전체 연관 연구와 같은 유전적 연관성 연구에서는 화산 플롯의 한 점이 단일 뉴클레오티드 다형성을 나타낸다.x 값은 승산비가 될 수 있으며 y 값은 카이-제곱 검정 또는 카이-제곱 검정 통계량p 값 -log일10 수 있다.[3]

화산도는 x축, 즉 밑의 로그-폴드가2 변화하면 일반적으로 정규 분포인 반면, y축, 로그-p10 값은 0에서 더 강하게 벗어나는 접이식 변화에 대해 더 큰 유의성을 보이는 경향이 있기 때문에 두 팔 위쪽의 특성을 보여준다.정규 분포의 밀도가 형태를 취함

= -

따라서 그 중 }은(는)

음의 (는)

팔은 왼쪽과 오른쪽 위로 뻗은 포물선이다.데이터의 상한은 한 포물선이고 하한은 다른 포물선이다.

참조

  1. ^ Cui, X.; Churchill, G. A. (2003). "Statistical tests for differential expression in cDNA microarray experiments". Genome Biology. 4 (4): 210. doi:10.1186/gb-2003-4-4-210. PMC 154570. PMID 12702200.
  2. ^ Li, W. (2012). "Volcano plots in analyzing differential expressions with mRNA microarrays". Journal of Bioinformatics and Computational Biology. 10 (6): 1231003. arXiv:1103.3434. doi:10.1142/S0219720012310038. PMID 23075208.
  3. ^ Li, W.; Freudenberg, J.; Suh, Y. J.; Yang, Y. (2014). "Using volcano plots and regularized-chi statistics in genetic association studies". Computational Biology and Chemistry. 48: 77–83. arXiv:1308.6245. doi:10.1016/j.compbiolchem.2013.02.003. PMID 23602812. S2CID 12399345.

외부 링크