기초 통계분석 - 21 - 표현 정리

'R 통계분석(제대로 알고 쓰는) - 이윤환저'의 책을 통해 기초 통계분석 학습

정민호정민호

1. 용어 및 표현

1.1. 확률과 확률분포

  • 시행(=실험,=확률시행,=확률실험) : E

  • 표본공간 : Ω

  • 평균 : μ

    • 모집단에서의 평균 : μ

    • 표본에서의 평균 : \$bar X\$

  • 분산 : 편차 제곱(²)의 평균

    • 모집단에서의 분산 : σ²

    • 표본에서의 분산 :

  • 표준편차 : 분산의 제곱근(√)

    • 모집단에서의 표준편차 : σ = \$sqrt σ^{2}\$

    • 표본에서의 표준편차 : s = \$sqrt s^{2}\$

  • 사건 : A, B, C, …​

    • 배반사건 : A ∩ B = ∅

    • 독립사건 : A ⊥ B

  • 확률

    • 수학적확률 : \$1 / O\$

      • 시행의 결과로 나올 수 있는 결과 수 : O

    • 통계적확률 : \$P(A) = n / N\$

      • 실험 횟수 : N

      • 사건발생 횟수 : n

    • 조건부확률 : P(A|B)

  • 확률변수

    • 확률변수 : X, Y, Z, …​

    • 확률변수실수값 : x, y, z, …​

    • 확률변수(X)의 평균 : \$bar X\$

    • 확률변수(X)의 기댓값 : E(X)

    • 확률변수(X)의 분산 : Var(x) = E[(X - E(X))²]

  • 분포함수

    • 누적분포함수 : F(x)

  • 베르누이 시행 : Bernoulli(p)

    • 베르누이 시행의 기댓값 : p = E(X)

    • 베르누이 시행의 분산 : p * (1 - p) = Var(X)

  • 이항분포 : B(n, p)

    • 이항분포를 따르는 확률변수(X) : X ~ B(n, p)

    • 이항분포의 기댓값 : np = E(X)

    • 이항분포의 분산 : np(1 - p) = Var(X)

  • 정규분포

    • 정규분포의 모수 : N(μ, σ²)

    • 정규분포의 분포함수 : F(x) = P(X ≤ x)

    • 표준정규분포 : Z

    • 표준정규분포(Z)와 정규분포

      • \$Z = {X - mu} / sigma = {확률변수(X) - 평균(mu)} / {표준편차(sigma)}\$

    • 표준정규분포의 값(z)과 정규분포의 값(x) 변환 : x = μ + z · σ

      • _x = μ + z · σ = 정규분포값(x) = 평균(μ) + 표준정규분포값(z) * 표준편차(σ)

1.2. 표본분포

  • 모수 : P

  • 표본분포 : \$((N), (n)) = {N!} / {n! * (N - n)!}\$

    • \$((모집단크기(N)), (표본크기(n))) = {모집단크기(N)!} / {표본크기(n)! * (모집단크기(N) - 표본크기(n))!}\$ ⇒ \$((100), (10)) = {100!} / {10! * 90!}\$

    • 모집단의 크기 : N

    • 표본의 크기 : n

  • 표본평균 분포의 기댓값 : \$E(bar X) = sum_{bar X} bar x * p(bar x)\$

  • 표본평균² 의 기댓값 : \$sum_{bar X} bar x^{2} * p(bar x)\$

  • 표본평균 분포의 분산 : \$Var(bar X) = ( sum_{bar X} bar x^{2} * p(bar x) ) - E(bar X) \$