1. 사건과 확률의 개념
1) 확률(P; probability): 여러 가능한 결과 중 하나 또는 일부가 일어날 가능성으로 0과 1 사이의 값으로 정의
- 실험(Experiment), 시행(Trial): 여러 가능한 결과 중 하나가 일어나도록 하는 행위
- 표본공간(Sample Space): 실험에서 나타날 수 있는 모든 결과를 나열한 집합 (Ω or S)
- 사건(Event): 표본공간의 일부분(부분집합) 사건A가 일어날 확률; P(A) or Pr(A) = 사건(A)의 원소 수 / 표본공간(Ω)의 원소 수
- 복원 추출: 모든 시행에서 똑같은 상황으로 시행하는 방법
- 비복원 추출: 앞의 시행이 다음 시행에 영향을 주는 방법
2) 경우의 수: 표본공간에서 사건A가 발생할 확률
- 사건의 연산: 합사건, 곱사건, 여사건, 배반사건
- 팩토리얼(!): 1부터 어떤 양의 정수 n까지의 정수를 모두 곱한 것
def fac(n):
if n == 0:
return 1
elif n == 1:
return 1
else:
return n * fac(n-1)
3) 공리: 증명을 필요로 하지 않거나 증명할 수 없지만 직관적으로 자명한 진리의 명제인 동시에 다른 명제들의 전제가 되는 명제
- 모든 사건 A에 대하여 0 ≤ P(A) ≤ 1
- 표본공간 Ω에 대하여 P(Ω) = 1
- 서로 배반인 사건들이 일어날 전체 확률은 각각의 확률을 더한 것과 같다
2. 순열과 조합
1) 순열(Permutations): 서로 다른 n개의 원소 중에서 r개를 순서를 고려하여 뽑는 경우의 수; nPr = n! / (n-r)!
- from itertools import permutations
list(permutations([n], r))
2) 조합(Combinations): 서로 다른 n개의 원소 중에서 r개를 순서를 고려하지 않고 뽑는 경우의 수; nCr = nPr / r! = n! / ((n-r)! * r!)
- from intertools import combinations
list(combinations([n], r))
- nCr = nCn-r
3) 중복순열: 서로 다른 n개의 원소 중에서 중복을 허용하여 r 개의 순서를 고려하여 뽑는 경우의 수; n∏r = n^r
- from intertools import product
list(product([n], repeat = r))
4) 중복조합: 서로 다른 n개의 원소 중에서 중복을 허용하여 r 개의 순서를 고려하지 않고 뽑는 경우의 수; nΗr = n+r-1Cr
- from intertools import combinations_with_replacement
list(combinations_with_replacement([n], r))
3. 조건부 확률과 독립
1) 독립: 사건A와 사건B 사이에 연관성이 없음
- P(A|B) = P(A∩B)/P(B) = P(A)*P(B)/P(B) = P(A)
4. 확률 분포
1) 확률변수가 가질 수 있는 값을이 무엇이며, 그 값을 가질 가능성 또는 확률이 어떻게 분포하는지를 0 이상의 실수로 나타낸 것
- 확률변수: 각각의 근원사건에 실수값을 대응시킨 함수로 X, Y 대문자로 표시. 시행을 하기 전엔 어떤 값을 갖게 될 지 알 수 없다는 불확실성을 표현
2) 이산확률분포: 확률변수의 값의 개수를 셀 수 있는 경우
- f(x) = P(X=x)
- 확률질량함수: 어떤 확률변수 x가 갖는 확률을 나타내는 함수 (y = f(x)), 모든 값 x에 대해 0 ≤ f(x) ≤ 1 이고, ∑f(x) = 1
- 베르누이분포, *이항분포, 기하분포, 음이항분포, 초기하분포, 포아송분포
3) 연속확률분포: 확률변수의 값이 연속적인 구간에 속하는 경우 (셀 수 없음)
- 확률밀도함수: 연속확률변수 X가 갖는 확률의 분포를 표현, 어느 구간의 확률이 더 크고 작은지 나타낼 수 있는 함수를 이용
- 모든 값에 대해 f(x) = 0 (구간이 값을 가짐)
- ∫f(x)dx: a~b 구간의 확률은 그 구간의 f(x)를 적분한 값과 같다.
- 전체 구간을 적분했을 때 확률밀도함수 함수값은 1이다.
- 균일분포, 지수분포, 감마분포, *정규분포, 베타분포
4) 누적분포함수 (이산형/연속형)
- X가 가질 수 있는 가장 작은 값부터 x까지 해당하는 확률질량함수의 값을 누적해서 더한 것
- F(x) = P(X ≤ x)
'공부 > 확률통계' 카테고리의 다른 글
비전공자 ADsP 자격증 합격 취득 후기 (0) | 2023.06.15 |
---|---|
[프로그래밍 확률 통계] 02 논리적인 자료의 요약 (0) | 2023.05.22 |
[프로그래밍 확률 통계] 01 시각화를 통한 자료의 요약 (0) | 2023.05.21 |