히비스서커스의 블로그

[기초확률론 7] 기댓값과 분산 본문

Theory/Statistics

[기초확률론 7] 기댓값과 분산

HibisCircus 2021. 3. 19. 23:58
728x90

기초확률론 일곱번째 포스팅으로 기댓값과 분산에 대해 알아보겠습니다.

 

 

저번 시간에는 확률변수와 확률분포함수에 대해 알아보았습니다.

2021.02.12 - [Statistics/Probability_Theory] - [기초확률론 6] 확률변수와 확률분포함수

 

[기초확률론 6] 확률변수와 확률분포함수

기초확률론 여섯번째 포스팅으로 확률변수와 확률분포함수에 대해 알아보겠습니다. 전반적인 내용은 충북대학교 최정배 강사님의 강의 내용을 참고하였음을 밝힙니다. 저번 시간에는독립사건

biology-statistics-programming.tistory.com

 

이번에 살펴볼 내용은 확률변수의 기댓값(E(X))과 분산(Var(x))에 관한 내용입니다. 앞서 살펴보았듯이 확률변수이산형 확률변수와 연속형 확률변수가 존재하였습니다. 이 둘의 기댓값을 구하는 방법은 다릅니다.

 

 

 

기댓값

 

정의

 

먼저, 이산형 확률변수 X 가 확률분포함수(=확률질량함수, PMF; Probability Mass Function) f(x)를 가지는 경우 다음과 같이 나타냅니다.

μ=E(X)xRxf(x)

즉, X의 기댓값은 X가 택할 수 있는 가능한 값(xR)에 각각 그 값을 택할 확률(f(x))이 곱해진 가중평균입니다.

 

 

다음은 연속형 확률변수 X가 확률분포함수(=확률밀도함수, PDF; Probability Density Function) f(x)를 가지는 경우 다음과 같이 나타냅니다.

μ=E(X)xf(x)dx

즉, X의 기댒값은 X가 택할 수 있는 가능한 값(xR)에 각각 그 값을 택할 확률(f(x))이 곱을 적분해준 것입니다.

 

성질

 

여기서 기댓값은 놀라운 성질을 가지고 있는데요, 바로 위 식에 x뿐 아니라 x의 함수 g(x)가 들어가도 g(x)에 대한 기댓값을 구할 수 있다는 것입니다.

 

이산형 확률분포일 경우
E[g(X)]=xRg(x)f(x)

 

연속형 확률분포일 경우
E[g(x)]=g(x)f(x)dx

 

특별한 경우

또한, g(x)=xk,k=1,2,3,...와 같이 x의 제곱의 형태일 때 이 g(x)=xkxk차 적률이라 합니다.

 

이산형 확률분포일 경우
E(Xk)=xRxkf(x)

 

연속형 확률분포일 경우

E(Xk)=xkf(x)dx

분산

지금까지 기댓값이 가지는 의미에 대해서 살펴보았습니다. 기댓값(E(X)) 확률변수 X의 가능한 값들의 가중평균을 산출해주었습니다. 하지만, 이 값들에 대한 퍼짐의 정도에 대해서는 정보를 담고 있지 않습니다. 예를 들어보겠습니다.

 

확률변수 Y=0, 이때의 확률은 1이고
확률변수 Z=1,1, 이때의 확률은 각각 12이라고 해봅시다.

 

두 확률변수 기댓값은 0으로 갖지만 두 확률변수의 분포는 다르고 이들의 퍼짐의 정도도 다릅니다. 그렇다면 어떻게 이들의 퍼짐정도를 나타낼 수 있을까요? 바로 확률변수X와 확률변수X의 기댓값E(X)의 차이의 제곱에 대한 기댓값을 해주어 나타낼 수 있습니다. 이것이 바로 분산입니다.

 

정의

E(X)=μ라 할 때,

 

이산형 확률분포일 경우
σ2=Var(X)E[(Xμ)2]=xR(xμ)2f(x)

 

연속형 확률분포일 경우
σ2=Var(X)E[(Xμ)2]=(xμ)2f(x)dx

 

입니다.

 

오늘 알아본 기댓값E(X)=μ과 분산Var(X)=σx확률변수X의 분포에 대해서 잘 설명해주는 값들입니다. 다음 시간에는 정규분포에 대해서 알아보겠습니다.

 

 

 

2020.03.19

히비스서커스

728x90