산점도
Scatter plot산점도 | |
---|---|
![]() | |
품질 7대 기본 도구 중 하나 | |
최초 설명자 | 존 허셜[1] |
목적 | 두 정량적 변수 사이의 관계 유형(있는 경우)을 식별하는 방법 |

산점도(산점도, 산점도, 산점도, 산점도,[3] 산점도 또는 산점도라고도 함)는 데카르트 좌표를 사용하여 데이터 집합에 대해 일반적으로 두 변수에 대한 값을 표시하는 그림 또는 수학 다이어그램의 한 유형입니다.점이 코드화된 경우(색상/모양/크기) 하나의 추가 변수를 표시할 수 있습니다.데이터는 점의 집합으로 표시되며, 각각은 수평 축의 위치를 결정하는 한 변수의 값과 수직 [4]축의 위치를 결정하는 다른 변수의 값을 가집니다.
개요
산점도에서는 한 연속형 변수가 실험자의 관리 하에 있고 다른 연속형 변수가 실험자에 종속되어 있는 경우 또는 두 연속형 변수가 모두 독립되어 있는 경우에 사용할 수 있습니다.다른 파라미터에 의해 체계적으로 증가 또는 감소하는 파라미터가 존재하는 경우 제어 파라미터 또는 독립변수로 불리며 수평축을 따라 커스텀 플롯됩니다.측정된 변수 또는 종속 변수는 수직 축을 따라 사용자 정의로 표시됩니다.종속 변수가 없는 경우 두 변수 유형 중 하나를 축에 표시할 수 있으며 산점도에는 두 변수 간의 상관 정도(원인 관계가 아님)만 표시됩니다.
산점도에서는 특정 신뢰 구간을 가진 변수 간의 다양한 상관 관계를 제안할 수 있습니다.예를 들어 무게와 높이는 Y축에 있고 높이는 X축에 있습니다.상관 계수는 양수(상승), 음수(하강) 또는 늘(상관 없음)일 수 있습니다.점의 패턴이 왼쪽 아래에서 오른쪽 상단으로 기울면 연구 중인 변수 간에 양의 상관 관계가 있음을 나타냅니다.점 패턴이 왼쪽 위에서 오른쪽 아래로 기울면 음의 상관 관계를 나타냅니다.최적 적합선(또는 '추세선')을 그려 변수 간의 관계를 연구할 수 있습니다.변수 간의 상관 관계에 대한 방정식은 확립된 최적 절차에 의해 결정될 수 있습니다.선형 상관의 경우 최적 적합 절차를 선형 회귀 분석이라고 하며 유한 시간 내에 올바른 솔루션을 생성할 수 있습니다.임의의 관계에 대한 올바른 솔루션을 생성하기 위한 범용 최적 절차는 없습니다.두 개의 비교 가능한 데이터 집합이 변수 간의 비선형 관계를 표시하는 데 어떻게 동의하는지 확인하려는 경우에도 산란도가 매우 유용합니다.LOESS와 [5]같은 매끄러운 선을 추가하면 이 기능을 향상시킬 수 있습니다.또한 데이터가 단순한 관계의 혼합 모형으로 표현되는 경우, 이러한 관계는 중첩 패턴으로 시각적으로 명확해집니다.
산란도는 품질관리를 [6]위한 7가지 기본 도구 중 하나입니다.
분산형 차트는 버블,[7] 마커 또는 꺽은선형 차트의 형태로 만들 수 있습니다.
예
예를 들어, 한 사람의 폐활량과 그 사람이 숨을 참을 수 있는 시간 사이의 연관성을 보여주기 위해, 연구자는 연구할 사람들을 선택하고 나서 각각의 폐활량(첫 번째 변수)과 그 사람이 숨을 참을 수 있는 시간(두 번째 변수)을 측정할 것이다.그런 다음, 연구자는 데이터를 산점도(saccapacity)로 표시하여 수평 축에 "lung capacity"를 할당하고 수직 축에 "숨을 참는 시간"을 할당합니다.
21.7초 동안 숨을 참은 폐용량 400cl의 사람은 데카르트 좌표의 점(400, 21.7)에서 산점도 위에 하나의 점으로 표시된다.연구에 참여한 모든 사람들의 산점도에서는 연구자가 데이터 집합의 두 변수를 시각적으로 비교할 수 있으며 두 변수 사이에 어떤 종류의 관계가 있을 수 있는지를 결정하는 데 도움이 될 것이다.
산점도 행렬
데이터 변수(차원) 집합1 X, X2, ..., X의k 경우 산점도 행렬은 변수의 모든 쌍별 산점도 행렬 형식으로 여러 산점도(sacterplot)를 단일 뷰에 표시합니다.k개의 변수의 경우 산점도 행렬에는 k개의 행과 k개의 열이 포함됩니다.행과 j번째 열의 교차점에 있는 그림은 변수i X 대 [8]X의j 그림입니다.즉, 각 행과 열은 하나의 차원이며 각 셀은 2차원의 산점도입니다.
일반화 산점도[9] 행렬은 범주형 변수와 정량적 변수의 쌍체 조합을 다양하게 표시합니다.모자이크 그림, 변동 다이어그램 또는 면 막대 차트를 사용하여 두 개의 범주형 변수를 표시할 수 있습니다.다른 그림은 하나의 범주형 변수와 하나의 정량적 변수에 사용됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Friendly, Michael; Denis, Dan (2005). "The early origins and development of the scatterplot". Journal of the History of the Behavioral Sciences. 41 (2): 103–130. doi:10.1002/jhbs.20078. PMID 15812820.
- ^ wci.llnl.gov에서 VisIt를 사용하여 작성된 시각화입니다.최종 갱신일 :2007년 11월 8일
- ^ Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication ed.). Dubuque, Iowa: Wm. C. Brown Pub. p. 492. ISBN 978-0-697-21595-6.
When we search for a relationship between two quantitative variables, a standard graph of the available data pairs (X,Y), called a scatter diagram, frequently helps...
- ^ 제시카 M.See Through Statistics 제3판, Thomson Brooks/Cole, 2005, 페이지 166-167.ISBN 0-534-39402-7
- ^ Cleveland, William (1993). Visualizing data. Murray Hill, N.J. Summit, N.J: At & T Bell Laboratories Published by Hobart Press. ISBN 978-0963488404.
- ^ Nancy R. Tague (2004). "Seven Basic Quality Tools". The Quality Toolbox. Milwaukee, Wisconsin: American Society for Quality. p. 15. Retrieved 2010-02-05.
- ^ "Scatter Chart - AnyChart JavaScript Chart Documentation". AnyChart. Retrieved 3 February 2016.
- ^ itl.nist.gov의 산점도 행렬.
- ^ Emerson, John W.; Green, Walton A.; Schoerke, Barret; Crowley, Jason (2013). "The Generalized Pairs Plot". Journal of Computational and Graphical Statistics. 22 (1): 79–91. doi:10.1080/10618600.2012.694762. S2CID 28344569.