해야겠지?

공부/확률통계

[프로그래밍 확률 통계] 03 확률

jinyong 2023. 5. 25. 23:26
728x90
반응형

1. 사건과 확률의 개념

  1) 확률(P; probability): 여러 가능한 결과 중 하나 또는 일부가 일어날 가능성으로 0과 1 사이의 값으로 정의
    - 실험(Experiment), 시행(Trial): 여러 가능한 결과 중 하나가 일어나도록 하는 행위
    - 표본공간(Sample Space): 실험에서 나타날 수 있는 모든 결과를 나열한 집합 (Ω or S)
    - 사건(Event): 표본공간의 일부분(부분집합) 사건A가 일어날 확률; P(A) or Pr(A) = 사건(A)의 원소 수 / 표본공간(Ω)의 원소 수
    - 복원 추출: 모든 시행에서 똑같은 상황으로 시행하는 방법
    - 비복원 추출: 앞의 시행이 다음 시행에 영향을 주는 방법

  2) 경우의 수: 표본공간에서 사건A가 발생할 확률
    - 사건의 연산: 합사건, 곱사건, 여사건, 배반사건
    - 팩토리얼(!): 1부터 어떤 양의 정수 n까지의 정수를 모두 곱한 것

def fac(n):
	if n == 0:
		return 1
	elif n == 1:
		return 1
	else:
		return n * fac(n-1)



  3) 공리: 증명을 필요로 하지 않거나 증명할 수 없지만 직관적으로 자명한 진리의 명제인 동시에 다른 명제들의 전제가 되는 명제
    - 모든 사건 A에 대하여 0 ≤ P(A) ≤ 1
    - 표본공간 Ω에 대하여 P(Ω) = 1
    - 서로 배반인 사건들이 일어날 전체 확률은 각각의 확률을 더한 것과 같다

2. 순열과 조합

  1) 순열(Permutations): 서로 다른 n개의 원소 중에서 r개를 순서를 고려하여 뽑는 경우의 수; nPr = n! / (n-r)!
    - from itertools import permutations
      list(permutations([n], r))

  2) 조합(Combinations): 서로 다른 n개의 원소 중에서 r개를 순서를 고려하지 않고 뽑는 경우의 수; nCr = nPr / r! = n! / ((n-r)! * r!)
    - from intertools import combinations
      list(combinations([n], r))
    - nCr = nCn-r

  3) 중복순열: 서로 다른 n개의 원소 중에서 중복을 허용하여 r 개의 순서를 고려하여 뽑는 경우의 수; n∏r = n^r
    - from intertools import product
      list(product([n], repeat = r))

  4) 중복조합: 서로 다른 n개의 원소 중에서 중복을 허용하여 r 개의 순서를 고려하지 않고 뽑는 경우의 수; nΗr = n+r-1Cr
    - from intertools import combinations_with_replacement
      list(combinations_with_replacement([n], r))

3. 조건부 확률과 독립
  1) 독립: 사건A와 사건B 사이에 연관성이 없음
    - P(A|B) = P(A∩B)/P(B) = P(A)*P(B)/P(B) = P(A)

4. 확률 분포

  1) 확률변수가 가질 수 있는 값을이 무엇이며, 그 값을 가질 가능성 또는 확률이 어떻게 분포하는지를 0 이상의 실수로 나타낸 것
    - 확률변수: 각각의 근원사건에 실수값을 대응시킨 함수로 X, Y 대문자로 표시. 시행을 하기 전엔 어떤 값을 갖게 될 지 알 수 없다는 불확실성을 표현

  2) 이산확률분포: 확률변수의 값의 개수를 셀 수 있는 경우
    - f(x) = P(X=x)
    - 확률질량함수: 어떤 확률변수 x가 갖는 확률을 나타내는 함수 (y = f(x)), 모든 값 x에 대해 0 ≤ f(x) ≤ 1 이고, ∑f(x) = 1
    - 베르누이분포, *이항분포, 기하분포, 음이항분포, 초기하분포, 포아송분포

  3) 연속확률분포: 확률변수의 값이 연속적인 구간에 속하는 경우 (셀 수 없음)
    - 확률밀도함수: 연속확률변수 X가 갖는 확률의 분포를 표현, 어느 구간의 확률이 더 크고 작은지 나타낼 수 있는 함수를 이용
    - 모든 값에 대해 f(x) = 0 (구간이 값을 가짐)
    - ∫f(x)dx: a~b 구간의 확률은 그 구간의 f(x)를 적분한 값과 같다.
    - 전체 구간을 적분했을 때 확률밀도함수 함수값은 1이다.
    - 균일분포, 지수분포, 감마분포, *정규분포, 베타분포

  4) 누적분포함수 (이산형/연속형)
    - X가 가질 수 있는 가장 작은 값부터 x까지 해당하는 확률질량함수의 값을 누적해서 더한 것
    - F(x) = P(X ≤ x)







728x90
반응형