일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- aiffel exploration
- ssh
- Decision Boundary
- GIT
- 오블완
- cocre
- docker attach
- airflow
- numpy
- 코크리
- docker
- 티스토리챌린지
- 히비스서커스
- 기초확률론
- 프로그래머스
- docker exec
- IVI
- logistic regression
- HookNet
- 도커
- Multi-Resolution Networks for Semantic Segmentation in Whole Slide Images
- cs231n
- vscode
- 사회조사분석사2급
- CellPin
- 백신후원
- WSSS
- Jupyter notebook
- Pull Request
- AIFFEL
- Today
- Total
히비스서커스의 블로그
[기초확률론 6] 확률변수와 확률분포함수 본문
기초확률론 여섯번째 포스팅으로 확률변수와 확률분포함수에 대해 알아보겠습니다.
저번 시간에는독립사건에 대해 알아보았습니다.
2021.02.05 - [Statistics/Probability_Theory] - [기초확률론 5] 독립사건
[기초확률론 5] 독립사건
기초확률론 다섯번째 포스팅으로 독립사건에 대해 알아보겠습니다. 전반적인 내용은충북대학교 최정배 강사님의 강의 내용을 참고하였음을 밝힙니다. 저번 시간에는 조건부확률, 곱셈법칙, 베
biology-statistics-programming.tistory.com
이번에 살펴볼 확률변수 개념은 저의 개인적인 생각으로 확률론의 핵심이라고 생각합니다. 또한, 수리통계학을 공부하는데에 있어서 모르면 안될 너무나 중요한 개념이기도 하죠. 아무리 강조해도 중요한 개념이기에 꼭 살펴보시길 바라겠습니다.
확률변수의 정의에 대해 바로 알아보기에 전에 앞의 내용들을 정리해보며 확률변수가 왜 필요한지를 전체적으로 정리해보겠습니다.
우리는 지금까지 확률실험 하에서 표본공간을 구하고 확률측도를 통해 확률을 구하였었죠.
확률실험이란, 실험에 모든 결과를 알 수 있으나 실제 실험을 하기 전에는 결과를 알 수 없고 동일한 조건에서 반복할 수 있는 실험입니다.
표본공간이란, 확률실험이 일어났을 때 나올 수 있는 결과들의 집합입니다.
표본공간에는 이산표본공간과 연속표본공간이 존재하였습니다.
이산표본공간이란 표본공간의 수가 유한개인 경우를 말합니다.
연속표본공간이란 표본공간의 수가 무한개인 경우를 말합니다.
두 표본공간의 확률측도는 달랐습니다.
이산표본공간의 확률측도는 시그마를 통해 확률을 구하였습니다.
연속표본공간의 확률측도는 적분을 통해 확률을 구하였습니다.

이산표본공간에서 예를 들어 설명해보겠습니다. (H: Head로 동전의 앞면, T: Tail로 동전의 뒷면)
확률실험: 동전을 세 번 던지는 실험
표본공간: S = {HHH,HHT,HTH,THH,TTH,THT,HTT,TTT}, (H: Head로 동전의 앞면, T: Tail로 동전의 뒷면)
확률: 임의의 ω∈S, P({ω}) = 18
여기서, 저희가 동전의 앞면이 0, 1, 2, 3번 나오는 사건에 대해서 확률을 구하고 싶다고 해봅시다. 이를 나타내보면 다음과 같습니다.
E0 = {TTT}, P(E0)=18
E1 = {TTH,THT,HTT}, P(E1)=38
E2 = {HHT,HTH,THH}, P(E2)=38
E3 = {HHH}, P(E3)=18
이를 좀 더 간단하게 나타내는 방법을 한 번 생각본다면 함수를 사용하는 방법이 있을 겁니다. 함수 X를 동전을 세 번 던졌을 때 나오는 H의 수라 해봅시다.
X(TTT)=0, P(X=0)=18
X(TTH)=X(TTH)=X(TTH)=1, P(X=1)=38
X(HHT)=X(HTH)=X(THH)=2, P(X=2)=38
X(HHH)=3, P(X=3)=18
확률변수를 사용하니 확률변수에 따라서 확률의 분포를 확인하기 용이할 것 같지 않나요? 확률변수에서 중요한 점은 확률변수는 분포를 갖는다는 점입니다.

확률변수
이제 확률변수(random variable) 개념에 대해서 알아봅시다.
정의
확률변수란, 정의역이 표본공간이고 공역이 실수인 함수이다.
분류
1) 이산형 확률변수: 확률변수 X가 가질 수 있는 값이 셀 수 있을 때, (셀 수 없을 때도 가능)
2) 연속형 확률변수: 확률변수 X가 가질 수 있는 값이 셀 수 없을 때
기호정의
P({ω∈S|X(ω)∈B }) ≡P(X∈B), B⊂R
다음으로 확률측도에 확률변수를 넣어준 함수인 확률분포함수에 대해서 알아보도록 하죠. 앞서 확률변수는 분포를 갖는다고 하였죠? 확률분포는 확률변수가 취하는 값에 대한 가능성을 확률적 구조로 나타낸 것이라고 할 수 있습니다. 확률변수가 이산형 확률변수인 경우와 연속형 확률변수인 경우가 있으므로 이때의 확률분포함수도 다르겠죠? 한 번 살펴보도록 합시다. (참고 . 여기서는 연속표본공간에 대해 이산형 확률변수를 갖는 경우는 생각하지 않았습니다.)

확률분포함수
임의의 x∈R에 대해서 확률변수X의 확률분포함수가 f(x)이다 <=> X ~ f(x)=P(X=x)
1) 이산형 확률변수인 경우
- 0≤f(x)≤1
- ∑x∈R=1
- P(a≤X≤b)=∑a≤X≤bf(x)
2) 연속형 확률변수인 경우
- 0≤f(x)≤∞
- ∫∞−∞f(x)dx=1
- P(a≤X≤b)=∫baf(x)dx
다음 시간에는 기댓값과 분산에 대해 알아보도록 하겠습니다.
2021.02.12
히비스서커스
'Theory > Statistics' 카테고리의 다른 글
[Column] 중심극한정리(CLT; central limit theorem) (0) | 2021.03.26 |
---|---|
[기초확률론 7] 기댓값과 분산 (0) | 2021.03.19 |
[기초확률론 5] 독립사건 (0) | 2021.02.05 |
[기초확률론 4] 조건부확률, 곱셈법칙, 베이즈 정리 (0) | 2021.01.29 |
[기초확률론 3] 확률측도의 성질, 균등확률결과를 갖는 표본공간 (0) | 2021.01.22 |