다변량 랜덤 변수

Multivariate random variable

확률통계에서 다변량 랜덤 변수 또는 랜덤 벡터는 값이 아직 발생하지 않았거나 값에 대한 불완전한 지식이 있기 때문에 값을 알 수 없는 수학 변수의 목록이다. 랜덤 벡터의 개별 변수는 모두 단일 수학적 시스템의 일부이기 때문에 함께 그룹화된다. 즉, 개별 통계 단위의 서로 다른 속성을 나타낸다. 예를 들어, 주어진 사람이 특정한 나이, 키, 몸무게를 가지고 있는 반면, 그룹 내에서 불특정 다수를 나타내는 것은 무작위 벡터일 것이다. 일반적으로 임의 벡터의 각 원소는 실제 숫자다.

랜덤 벡터는 다양한 유형의 집합 랜덤 변수(예: 랜덤 매트릭스, 랜덤 트리, 랜덤 시퀀스, 확률 프로세스 등)의 기본 구현으로 자주 사용된다.

More formally, a multivariate random variable is a column vector (or its transpose, which is a row vector) whose components are scalar-valued random variables on the same probability space as each other, {\\Oomega}이) 샘플 공간이고, 시그마-알지브라(모든 이벤트의 모음), P이( 확률을 반환하는 함수)이다.

확률분포

모든 무작위 벡터는 보렐 대수학을 기본 시그마-알지브라로 {\에 확률 측도를 발생시킨다. 이 척도는 랜덤 벡터의 공동 확률 분포, 공동 분포 또는 다변량 분포라고도 한다.

각 성분 랜덤 변수 분포한계 분포라고 한다. 주어진 displaystyle X_{j조건부 확률 분포 특정 값으로 알려진 경우 X 의 확률 분포다.

The cumulative distribution function of a random vector is defined as[1]: p.15

(Eq.1)

여기서 =( ,… ,x )

랜덤 벡터에 대한 작업

무작위 벡터는 비랜덤 벡터(추출, 뺄셈, 스칼라에 의한 곱셈, 내부 제품 섭취)와 같은 종류의 대수적 연산을 받을 수 있다.

아핀 변환

마찬가지로 새로운 벡터 Y \ {는) 임의 벡터 아핀 변환 : Rn → style g을 적용하여 정의할 수 있다

= + = { + 서 An\ 행렬은 }이고 b은 열 벡터입니다

이(가) 변환 불가능한 행렬이고 X mathbf {이(가) 확률밀도함수 {(가)인 , Y의 확률밀도 된다.

되돌릴 수 없는 매핑

더 일반적으로 우리는 무작위 벡터의 되돌릴 수 없는 매핑을 연구할 수 있다.[2]: p.290–291

Let be a one-to-one mapping from an open subset of onto a subset of , let have continuous partial derivatives in and let the Jacobian determinant of be zero at no point of . Assume that the real random vector has a probability density function and satisfies . Then the random vector is of probability density

where denotes the indicator function and set denotes support of .

기대값

랜덤 벡터 {기대값 또는 평균은 각 랜덤 의 기대값인 고정 벡터 E [ X ] {mathbf {이다.[3]: p.333

(Eq.2)

공분산 및 교차 공분산

정의들

랜덤 벡터의 공분산 행렬(두 번째 중심 모멘트 또는 분산-공분산 행렬이라고도 함)은 n n 행렬이며, (i,j)th 요소는 i th j 랜덤 th 변수 사이의 공분산이다. The covariance matrix is the expected value, element by element, of the matrix computed as 여기서 위첨자 T는 표시된 벡터의 전치(transpose)를 가리킨다.[2]: p. 464 [3]: p.335

(Eq.3)

By extension, the cross-covariance matrix between two random vectors and ( having elements and having elements) is the [3]: p.336

(Eq.4)

여기서 다시 매트릭스 기대치가 매트릭스에서 요소별로 취해진다. 여기서 (i,j)th 요소는 의 i 요소 th 의 j 요소 사이 th 공분산이다

특성.

공분산 행렬은 대칭 행렬이다.[2]: p. 466

= {X}}}}}}}}}.

공분산 행렬은 양의 세미데마인 행렬이다.[2]: p. 465

.

The cross-covariance matrix is simply the transpose of the matrix , i.e.

= Y {X}\{X}

상관성 없음

개의 임의 벡터 X=( X ,.. . , ) T }, displaystym} =( ,... . Y ) T = 은(는) 다음과 같이 무관하다고 한다.

.

교차 공분산 행렬 X 이(가) 0인 경우에만 상관 관계가 없다.[3]: p.337

상관관계 및 교차상관

정의들

랜덤 벡터의 상관 행렬(두 번째 모멘트라고도 함)은 n {\ n n 행렬이며, (i,j)th 요소는 i th j 랜덤 th 변수 사이의 상관 계수다. 상관 행렬은 X \mathbf {X} \로 계산된 n n 행렬의 요소별 기대값이며 여기서 위첨자 T는 표시된 벡터의 전치를 가리킨다.[4]: p.190 [3]: p.334

(Eq.5)

By extension, the cross-correlation matrix between two random vectors and ( having elements and having elements) is the

(Eq.6)

특성.

상관 행렬은 다음과 같이 공분산 행렬과 관련된다.

.

교차 상관 행렬 및 교차 공분산 행렬의 경우에도 마찬가지로:

직교성

같은 크기 = (X ,.. .. ) })^{{n}}{{n}}}^{{ndisplaystystyle \mathbf. =( ,... . Y ) T = 을(를) 직교라고 한다.

[ T = .

독립,

모든 y 에 대해 독립적으로 호출되는 두 의 랜덤벡터 X {\ \mathbf {y}

where and denote the cumulative distribution functions of and and)은 공동 누적분포함수를 나타낸다. 의 독립성은 종종 X ⊥ Y . Written component-wise, and are called independent if for all

특성함수

The characteristic function of a random vector with components is a function that maps every vector 복잡한 숫자로. 에 의해[2]: p. 468 정의된다.

.

추가 특성

2차 형태 기대

무작위 X }에서 다음과 같이 2차 형태를 기대할 수 있다.[5]: p.170–171

여기서 (는) X{\의 공분산 행렬이며, {\은 주 대각선의 원소 을 가리킨다. 2차 형태는 스칼라(scalar)이기 때문이다.

Proof: Let be an random vector with and and let be an 비스토스테틱 행렬.

그런 다음 공분산 공분산으로 zT = X {\ {}=\ { z T =Y 다음과 같은 것을 알 수 있다.

그러므로

그래서 우리는 그것을 보여줘야 한다.

이는 최종 결과(예: ( )= (B A ) = tr ( ){\를 변경하지 않고 추적을 할 때 주기적인 허용을 할 수 있다는 사실에 근거한 것이다.

우리는 그것을 안다.

그리고 그 이후로

그럼 스칼라로군

대수롭지 않게 순열 방식을 사용하여 다음 작업을 수행하십시오.

이를 원래의 공식에 연결하면 다음과 같은 결과를 얻을 수 있다.

서로 다른 두 가지 형태의 제품에 대한 기대

0-mean 가우스 랜덤 X 의 두 가지 다른 2차 형태의 곱을 다음과 같이 예상할 수 있다.[5]: pp. 162–176

여기서 다시 (는) 의 공분산 행렬이다 다시 말하지만, 두 가지 이차 형태는 모두 스칼라이므로 제품에 대한 기대 또한 스칼라이다.

적용들

포트폴리오 이론

금융포트폴리오 이론에서 목표는 종종 무작위 포트폴리오 수익의 분포가 바람직한 특성을 갖도록 위험 자산의 포트폴리오를 선택하는 것이다. 예를 들어, 특정 기대치에 대해 가장 낮은 분산을 갖는 포트폴리오 수익을 선택할 수 있다. 여기서 랜덤 벡터는 개별 자산에 대한 랜덤 수익의 r 이며, 포트폴리오 리턴 p(임의 스칼라)는 포트폴리오 가중치의 벡터 w를 갖는 랜덤 수익 벡터의 내적 산물인 즉, 각 자산에 배치된 포트폴리오의 분율이다. p = wT = r {\ { 포트폴리오 수익의 기대 가치는 wET( )이고, 포트폴리오 수익의 분산은 wCwT 나타낼 수 있다. 여기서 C는 의 공분산 행렬이다

회귀이론

선형 회귀 이론에서, 우리는 종속 변수 y에 대한 관측치 n개와 각 k개의 독립 변수 xj 대한 관측치에 대한 데이터를 가지고 있다. 종속 변수에 대한 관측치는 열 벡터 y로 쌓이고, 각 독립 변수에 대한 관측치는 열 벡터에도 쌓이고, 이 열 벡터는 독립 변수에 대한 관측치의 설계 행렬 X(이 맥락에서 랜덤 벡터를 나타내지 않음)로 결합된다. 그런 다음 데이터를 생성한 프로세스에 대한 설명으로 다음 회귀 방정식을 가정한다.

여기서 β는 k 반응 계수의 가정된 고정되나 알 수 없는 벡터로서, e는 종속 변수에 대한 임의의 영향을 반영하는 미지의 무작위 벡터다. 일반적인 최소 제곱법과 같은 일부 선택된 기법에 의해 벡터 (를) β의 추정치로 선택하고, 로 표시된 벡터 e의 추정치를 다음과 같이 계산한다

그런 다음 통계학자는 랜덤 벡터로 간주되는 {\의 속성을 분석해야 하는데, 이는 관측할 사례의 무작위적으로 서로 다른 선택이 그들에 대해 다른 값을 가져올 수 있기 때문이다.

벡터 시계열

시간 경과에 따른 k× 랜덤벡터 X {\{X}의 진화는 다음과 같이 벡터 자기 회귀(VAR)로 모델링할 수 있다.

where the i-periods-back vector observation is called the i-th lag of , c is a k × 1 vector of constants (intercepts), Ai is a time-invariant k × k matrix and is a k × 1 random vector of error terms.

참조

  1. ^ Gallager, Robert G. (2013). Stochastic Processes Theory for Applications. Cambridge University Press. ISBN 978-1-107-03975-9.
  2. ^ a b c d e Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. ISBN 978-0-521-19395-5.
  3. ^ a b c d e Gubner, John A. (2006). Probability and Random Processes for Electrical and Computer Engineers. Cambridge University Press. ISBN 978-0-521-86470-1.
  4. ^ Papoulis, Athanasius (1991). Probability, Random Variables and Stochastic Processes (Third ed.). McGraw-Hill. ISBN 0-07-048477-5.
  5. ^ a b Kendrick, David (1981). Stochastic Control for Economic Models. McGraw-Hill. ISBN 0-07-033962-7.

추가 읽기

  • Stark, Henry; Woods, John W. (2012). "Random Vectors". Probability, Statistics, and Random Processes for Engineers (Fourth ed.). Pearson. pp. 295–339. ISBN 978-0-13-231123-6.