[수리통계학] [3.1] The Binomial and Related Distributions

2025. 3. 3. 18:25· Statistic Study/Mathematical Statistics(수리통계학)
목차
  1. 1. Introduction
  2. 1.1. Difinition [1] : Bernoulli Distribution
  3. 1.2. Binomial Distribution
  4. 2. Negative Binomial and Geometric Distribution
  5. 3. Multinomial Distribution
  6. 4. Hypergeometric Distribution

1. Introduction

1.1. Difinition [1] : Bernoulli Distribution

- Bernoulli Experiment는 실험 결과가 두 가지 상호 배타적이고 포괄적인 방식으로 분류될 수 있는 확률 실험을 의미한다.

- 예를 들어, 성공 or 실패(생존 또는 사망, 불량 또는 정상)과 같은 경우가 있다.

 

- 베르누이 시행이 여러 번 독립적으로 수행되면서 성공할 확률 p가 일정하게 유지되는 경우, 이를 "Bernoulli Trials"라고 한다.

- 이러한 실험에서 각 시행의 성공 확률을 p라고 정의한다.

 

- R.V. X가 베르누이 시행과 연관되어 있을 때, X를 다음과 같이 정의한다.

- X(성공) = 1 , X(실패) = 0

- 즉, 성공과 실패라는 두 가지 결과를 각각 1과 0으로 나타낸다.

- pmf는 다음과 같이 표현되게 된다.

- 이때, X가 Bernoulli Distribution을 따른다고 한다.

- Bernoulli Distribution의 Expectation은 다음과 같다.

 

- 분산은 다음과 같다.

 

1.2. Binomial Distribution

- n개의 independent한 베르누이 시행이 수행될 때, 성공 횟수를 R.V X로 정의할 수 있다.

- 이 경우 X의 가능한 값은 0,1,2,3,...,n이 된다.

 

- n번의 시행에서 정확히 x번 성공할 확률을 계산하기 위해, x개의 성공을 선택하는 방법의 수를 고려해야 한다.

- 이는 Binomial coefficient로 표현되며 다음과 같다.

- 각 시행이 독립적이므로 성공과 실패의 확률이 각각 p와 1-p일 때, 특정 x번 성공할 확률은 다음과 같이 표현된다.

 

- 이때, X가 Binomial Distribution을 따른다고 한다.

- Binomial Distribution의 Expectation과 Variance는 다음과 같다.(구하는 과정 생략)

 

2. Negative Binomial and Geometric Distribution

- independent한 베리누이 시행이 연속적으로 수행되며 성공확률이 p로 일정하다고 가정하자.

- R.V Y를 r번 성공하기 전까지 발생한 실패 총 횟수라고 정의하자.

- 즉, Y + r이 전체 시행 횟수를 의미하게 된다.

- 이 때, R.V Y의 pmf는 다음과 같이 표현된다.

 

- 이때, y가 negative Binomial Distribution을 따른다고 볼 수 있다.

- 이 때, Expectation과 Variance는 다음과 같다.

- E(Y) = r/p

- V(Y) = r(1-p) /p^2

 

- negative Binomial Distribution에서 r = 1인 경우, Geometric Distribution이라고 정의한다.

 

3. Multinomial Distribution

- Multinomial Distribution은 Bernoulli Distribution과 Binomial Distribution의 확장판이라고 할 수 있다.

- 여러 개의 범주로 이루어진 확률 분포를 다룰 때 사용된다.

- 즉, 한번의 실험에서 결과가 여러 개의 범주 중 하나로 나뉘는 경우에 적용된다.

 

- Multinomial Distribution은 n번의 독립적인 시행에서 각 시행이 k개의 가능한 범주 중 하나로 분류될 확률을 모델링한다.

-- 각 범주에 대한 성공확률이 p1,p2,...,pk (총합이 1)

-- 총 n번의 시행 후 각 범주에서의 발생횟수를 X1,X2,...,Xk라고 할 때,

-- Random Vector(X1,X2,...,Xk)는 multinomial Distribution을 따르게 된다.

- 이 때, pmf는 다음과 같다.

- 이때, Expectation, Variance, Covariance는 다음과 같다.

- E[Xi] = np_i

- Var[Xi] = np_i(1-p_i)

- Cov(Xi,Xj) = -np_ip_j

 

4. Hypergeometric Distribution

- Hypergeometric Distribution은 비복원 추출(without replaement)방식에서

- 특정 조건을 만족하는 사건이 발생할 확률을 나타내는 이산 확률 분포이다.

- 예를 들면 다음과 같다.

- N명의 사람들이 있다고 가정하자. 이중 D명은 남자, N-D명은 여자라고 하자.

- 이때, n명의 사람을 골랐을 때, 남자가 몇 명인지 묻는 문제가 Hypergeometric Distribution를 따른다고 할 수 있다.

 

- N개에서 n개를 뽑는 경우의 수는 다음과 같다.

 

- 우리가 뽑은 크기 n인 표본 안에 우리가 원하는 원소 x개가 들어 있을 경우의 수를 구해보자.

- 모집단에 있는 D개 중에서 x개가 뽑혀야한다.

- 그리고, 나머지는 N-D개 중에서 n-x개가 뽑히면 된다.

- 이걸 종합하여 우리가 구하고자 하는 Hypergeometric Distribution의 pmf는 다음과 같다.

 

- Hypergeometric Distribution의 Expectation과 Variance는 다음과 같다.

E(X) = Dn/N

 

'Statistic Study > Mathematical Statistics(수리통계학)' 카테고리의 다른 글

[수리통계학] [3.3] The Gamma,Chi-square, and Beta Distributions  (0) 2025.03.04
[수리통계학] [3.2] The Poisson Distribution  (0) 2025.03.03
[수리통계학] [2.X] 표본 분산에 n-1을 나눠주는 이유  (0) 2025.03.02
[수리통계학] [2.8] Linear Combinations of Random Variables  (0) 2025.03.02
[수리통계학] [2.7] Transformation for Several Random Variables  (0) 2025.03.02
  1. 1. Introduction
  2. 1.1. Difinition [1] : Bernoulli Distribution
  3. 1.2. Binomial Distribution
  4. 2. Negative Binomial and Geometric Distribution
  5. 3. Multinomial Distribution
  6. 4. Hypergeometric Distribution
'Statistic Study/Mathematical Statistics(수리통계학)' 카테고리의 다른 글
  • [수리통계학] [3.3] The Gamma,Chi-square, and Beta Distributions
  • [수리통계학] [3.2] The Poisson Distribution
  • [수리통계학] [2.X] 표본 분산에 n-1을 나눠주는 이유
  • [수리통계학] [2.8] Linear Combinations of Random Variables
23학번이수현
23학번이수현
23학번이수현
밑바닥부터 시작하는 AI보안전문가
23학번이수현
전체
오늘
어제
  • 분류 전체보기 (243)
    • Statistic Study (47)
      • Mathematical Statistics(수리통.. (47)
    • Mathematics Study (15)
      • Linear Algebra (선형대수학) (15)
    • CS Study (74)
      • CLRS (자료구조 | 알고리즘) (49)
      • Database(DB) (11)
      • C++ (11)
      • 컴퓨터 구조 (2)
      • MongoDB (1)
    • DS Study (56)
      • CS 229(Machine Learning) (19)
      • CS 224n(NLP) (5)
      • Web Scraping (7)
      • R4DS(R언어) (20)
      • 밑바닥부터 시작하는 딥러닝 1 (5)
    • Hacking Study (0)
      • Web Hacking (0)
    • 코딩테스트 (5)
      • 백준-Python (5)
    • Paper Review(논문 리뷰) (43)
      • Deep Learning (16)
      • TCGA 관련 논문 (4)
      • Computer Vision (18)
      • NLP (5)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 시간복잡도
  • cs229
  • 파이썬
  • R4DS
  • Data Structure
  • 논문 리뷰
  • deep learning
  • graph
  • Linear Algebra
  • 자료구조
  • R언어
  • db
  • C++
  • NLP
  • introduction to algoritmhs
  • Algorithms
  • cs 224n
  • 선형대수학
  • clrs
  • 알고리즘
  • 백준
  • LSTM
  • web scraping
  • Introduction to Algorithms
  • Machine Learning
  • 딥러닝
  • 정렬
  • 수리통계학
  • AI
  • 데이터분석

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
23학번이수현
[수리통계학] [3.1] The Binomial and Related Distributions
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.