기술 통계
Descriptive statistics| 시리즈의 일부 |
| 조사. |
|---|
| 철학 포털 |
기술 통계량(카운트 명사 의미)은 정보 [1]집합에서 특징을 정량적으로 기술하거나 요약하는 요약 통계량이며, 기술 통계량(매스 명사 의미)은 이러한 통계량을 사용하고 분석하는 과정이다.기술 통계량은 데이터를 사용하여 데이터의 [2]표본이 나타내는 모집단에 대해 배우는 것이 아니라 표본을 요약하는 것을 목적으로 하여 추리 통계량(또는 귀납 통계량)과 구별됩니다.이것은 일반적으로 기술 통계량이 추리 통계량과 달리 확률론에 기초해 개발되지 않으며, 종종 비모수 [3]통계량이라는 것을 의미한다.데이터 분석이 추리 통계를 사용하여 주요 결론을 도출하는 경우에도 일반적으로 기술 통계량도 [4]제시된다.예를 들어, 인간 피험자에 대한 보고서에서는 일반적으로 표가 포함되며, 전체 표본 크기, 중요한 하위 그룹의 표본 크기(예: 각 치료 또는 노출 그룹에 대한 표본 크기), 그리고 평균 연령, 각 성별의 피험자 비율, 관련된 공동체가 있는 피험자의 비율과 같은 인구통계학적 또는 임상적 특성을 제공한다.궤도 등
데이터 집합을 설명하는 데 일반적으로 사용되는 측정값으로는 중심 경향의 측정값과 변동성 또는 분산의 측정값이 있습니다.중심 경향의 측도에는 평균, 중위수 및 모드가 포함되며 변동성의 측도에는 표준 편차(또는 분산), 변수의 최소값과 최대값, 첨도 [5]및 왜도가 포함됩니다.
통계 분석에 사용
기술 통계량은 표본과 수행된 관측치에 대한 간단한 요약을 제공합니다.그러한 요약은 양적, 즉 요약 통계이거나 시각적인, 즉 이해하기 쉬운 그래프일 수 있다.이러한 요약은 보다 광범위한 통계 분석의 일부로서 데이터의 최초 설명의 기초를 형성하거나, 특정 조사에 충분할 수 있다.
예를 들어, 농구에서 슈팅 비율은 선수나 팀의 성적을 요약하는 설명적인 통계입니다.이 숫자는 샷 수를 샷 수로 나눈 것입니다.예를 들어, 33%를 쏘는 플레이어는 약 3개 중 1개를 쏘고 있습니다.백분율은 여러 이산 이벤트를 요약하거나 설명합니다.평점 평균도 고려하십시오.이 단일 숫자는 과정 [6]경험의 범위에 걸쳐 학생의 일반적인 성과를 나타냅니다.
기술 통계와 요약 통계의 사용은 광범위한 역사를 가지고 있으며, 실제로 모집단과 경제 데이터의 단순한 표가 통계의 주제가 등장한 첫 번째 방법이다.최근에는 탐색적 데이터 분석 제목으로 요약 기법 모음을 공식화했다. 그러한 기법의 예는 상자 그림이다.
비즈니스 세계에서 기술 통계는 다양한 유형의 데이터를 요약하는 유용한 정보를 제공합니다.예를 들어, 투자자와 중개자는 미래에 더 나은 투자 결정을 하기 위해 자신의 투자에 대한 경험적, 분석적 분석을 수행하여 수익행위의 과거 계정을 사용할 수 있다.
일변량 분석
일변량 분석에는 중심 추세(평균, 중위수 및 모드 포함)와 분산(데이터 집합의 범위와 사분위수, 분산 및 표준 편차 등의 산포 측도 포함)을 포함하여 단일 변수의 분포를 설명하는 작업이 포함됩니다.분포의 모양은 왜도 및 첨도와 같은 지수를 통해 설명할 수도 있습니다.변수 분포의 특성은 히스토그램 및 줄기-잎 표시를 포함하여 그래픽 또는 표 형식으로 표시될 수도 있습니다.
이변량 및 다변량 분석
표본이 둘 이상의 변수로 구성된 경우 기술 통계량을 사용하여 변수 쌍 간의 관계를 설명할 수 있습니다.이 경우 기술 통계 정보에는 다음이 포함됩니다.
일변량 분석과 이변량 분석을 구별하는 주된 이유는 이변량 분석이 단순한 기술 분석일 뿐만 아니라 두 다른 [7]변수 간의 관계를 설명하기 때문입니다.종속성의 정량적 측도에는 상관 관계(예: 두 변수가 연속형인 경우 Pearson의 r 또는 둘 다 연속형인 경우 Spearman의 rho)와 공분산(척도 변수가 측정되는 기준)이 포함됩니다.회귀 분석에서 기울기는 변수 간의 관계도 반영합니다.표준화되지 않은 기울기는 예측 변수의 단위 변화에 대한 기준 변수의 단위 변화를 나타냅니다.표준화된 기울기는 표준화된 (z-점수) 단위의 이러한 변화를 나타냅니다.심하게 치우친 데이터는 종종 대수를 사용하여 변환됩니다.로그를 사용하면 그래프가 더 대칭적이고 정규 분포와 비슷해 보여 직관적으로 [8]: 47 해석하기 쉬워집니다.
레퍼런스
- ^ Mann, Prem S. (1995). Introductory Statistics (2nd ed.). Wiley. ISBN 0-471-31009-3.
- ^ "Drawing Conclusions From Data: Descriptive Statistics, Inferential Statistics, and Hypothesis Testing", Interpreting and Using Statistics in Psychological Research, Thousand Oaks, CA: SAGE Publications, Inc, pp. 145–183, 2017, doi:10.4135/9781506304144.n6, ISBN 978-1-5063-0416-8, retrieved 2021-06-01
- ^ Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-850994-4.
- ^ "Drawing Conclusions From Data: Descriptive Statistics, Inferential Statistics, and Hypothesis Testing", Interpreting and Using Statistics in Psychological Research, Thousand Oaks, CA: SAGE Publications, Inc, pp. 145–183, 2017, doi:10.4135/9781506304144.n6, ISBN 978-1-5063-0416-8, retrieved 2021-06-01
- ^ Investopedia, 기술 통계 용어
- ^ Trochim, William M. K. (2006). "Descriptive statistics". Research Methods Knowledge Base. Retrieved 14 March 2011.
- ^ Babbie, Earl R. (2009). The Practice of Social Research (12th ed.). Wadsworth. pp. 436–440. ISBN 978-0-495-59841-1.
- ^ Nick, Todd G. (2007). "Descriptive Statistics". Topics in Biostatistics. Methods in Molecular Biology. Vol. 404. New York: Springer. pp. 33–52. doi:10.1007/978-1-59745-530-5_3. ISBN 978-1-58829-531-6. PMID 18450044.
외부 링크
- 기술 통계 강의:피츠버그 대학교 슈퍼코스: http://www.pitt.edu/~super1/super1/super1/lec0421/index.htm