2011년 7월 1일 금요일

와이블 분포 (Weibull Distribution)

이 분포는 종종 부품의 고장까지의 시간 혹은 수명 등과 같이 신뢰성과 수명시험 문제에
적용된다.


와이블 분포의 특성

모수인 척도모수(scale parameter)와 형상모수(shape parameter)에 따라 분포의 모양 변함.
특히, 형상모수가 1인 경우 지수 분포(exponential distribution),
          상모수가 2인 경우 라이레히 분포(Rayleigh distribution)가 된다.


와이블 분포의 용도

⊙ 부품의 수명 추정 분석
⊙ 신뢰성 공학에서 실패 분석
⊙ 산업 현장에서 어떤 제품의 제조에 걸리는 시간


확률밀도함수 (pdf: probability density function)








기대값과 분산 (expected value and variance)







와이블 분포 예제

* 어떤 제품의 수명시간 X가 형상모수 2.2, 척도모수 1,200 인 와이블 분포를 따른다고
   할 때, 이 제품이 적어도 1,500 시간 이상 작동할 확률을 구하라.
    > 척도모수 1200, 형상모수 2.2 인 와이블 분포로, 1,500 이상일 확률은 0.19518 이다.

 

F 분포 (F-distribution)

분산이 같은 두 정규모집단으로부터 크기 n1과 크기 n2의 확률표본을 반복하여 독립적으로
추출한 후 구한 두 표본분산의 비율들의 표본분포는 F분포를 따른다. F 확률변수는 다음과
같이 분자의 자유도 (n1-1)이고 분모의 자유도 (n2-1)인 F 분포를 따른다.







F 분포의 특성

⊙ 항상 양의 값을 가지며, 비대칭(오른쪽으로 긴 꼬리)적인 분포모양을 가진다.
⊙ 단일 분포가 아닌 모수인 분자의 자유도와 분모의 자유도에 따라 분포의 모양이
     변하는데, 분자의 자유도와 분모의 자유도가 커질 수록 정규분포에 가까워진다.

F 분포의 용도

⊙ 두 모분산의 비교, 추정 및 검정
⊙ 분산분석 및 회귀분석


확률밀도함수 (pdf: probability density function)












기대값과 분산  (expected value and variance)







F 분포 예제

* F 분포에서 분자의 자유도가 6, 분모의 자유도가 10일 때, 확률이 0.1 일 때의 확률변수
   값을 구하라.
    > 자유도 6, 10 인 F 분포로, 확률이 0.1 이면 F 확률변수값은 2.46058 이다.














* 위의 예제를 양측꼬리로 F 확률변수값을 구하라.
   > 자유도 6, 10 인 F 분포로, 확률이 0.1 이면 F 확률변수값은 0.24631 3.21717 이다.



카이제곱 분포 (Chi-square distribution)

정규분포를 따르는 모집단에서 크기가 n인 표본을 무작위로 반복하여 추출하였을 때,
각 표본에 대해 구한 표본분산들은 카이제곱 분포를 따른다. 카이제곱확률변수는
다음과 같이 자유도 (n-1)인 카이제곱 분포를 따른다.




카이제곱 분포의 특성

⊙ 항상 양의 값을 가지며, 비대칭(오른쪽으로 긴 꼬리)적인 분포모양을 가진다.
⊙ 단일 분포가 아닌 모수인 자유도에 따라 분포의 모양이 변하는데, 자유도가 커질 수록
     정규분포에 가까워진다.


카이제곱 분포의 용도

⊙ 모분산에 대한 추정과 검정
⊙ 관측도수가 이론상의 분포 또는 형태를 얼마나 잘 따르는 지에 대한 검증
⊙ 여러 집단 사이의 독립성 검정 (한 특성이 다른 특성에 영향을 미치는 가에 대한 검정)


확률밀도함수 (pdf: probability density function)









기대값과 분산 (expected value and variance)






카이제곱 분포 예제

* 카이제곱 분포에서 자유도가 5일 때, 확률이 0.1 일 때의 확률변수값을 구하라.
   > 자유도 5 인 카이제곱 분포로, 확률이 0.1 이면 카이제곱 확률변수값은 9.23635 이다.















* 카이제곱 분포에서 자유도가 3일 때, 확률변수값이 5 일 때의 확률을 구하라.
   > 자유도 3 인 카이제곱 분포로, 카이제곱 확률변수값 5 이면 0.17180 이다.


 

t 분포 (Student's t-distribution)

모평균과 모표준편차를 모르는 정규모집단에서 표본크기가 작은 경우에 모평균에 대한
추정과 검정을 할 경우 t 통계량을 이용하는데, 정규모집단으로 부터 크기 n인 표본을
무작위로 추출했을 때 표본통계량 t 는 자유도 (n-1)인 t 분포를 따른다.









t 분포의 특성

⊙ 표준정규분포와 유사(평균 0 이고 좌우 대칭인 종모양)하지만 표본 표준편차를 사용
     하기에 분산이 더 크다.
⊙ 단일 분포가 아닌 모수인 자유도에 따라 분포의 모양이 변하는데, 자유도가 커질 수록
     Z분포에 가까워진다.


확률밀도함수 (pdf: probability density function)











기대값과 분산 (expected value and variance)






t 분포 예제

* t 분포에서 자유도가 10일 때, 확률이 0.05 일 때의 t 확률변수값을 구하라.
   > 자유도 10 인 t 분포로, 확률이 0.05 이면 t 확률변수값은 1.81245 이다.














* 위의 예제를 양측꼬리로 t 확률변수값을 구하라.
    > 자유도 10 인 t 분포로, 확률이 0.05 일 때 t 확률변수값은 -2.22814 2.22814 이다.

정규 분포 (Normal distribution)

각종 자연현상이나 사회현상의 실제 응용에 있어 폭 넓게 사용되는 것으로 연속확률변수를
나타내는 가장 중요한 확률분포이다.


정규 분포의 특징

⊙ 정규곡선은 종모양을 나타낸다.
⊙ 평균을 중심으로 좌우대칭을 이룬다. (평균=중앙치=최빈치)
⊙ 모수인 평균과 분산이 주어지면 정규분포를 나타낼 수 있다.
⊙ 아래와 같이 68-95-99 rule 을 따른다.


확률밀도함수 (pdf: probability density function)











표준정규분포 (standard normal distribution)

표준정규분포는 정규분포에서 정규확률변수의 평균이 0 이고, 표준편차가 1 인 특별한
경우로 모든 정규확률변수 X는 위의 Z scale를 통해 z-점수(z-score)로 변환할 수 있다.


정규 분포 예제

* A 고등학교 3학년 1반 남학생들의 신장이 평균 170cm, 표준편차 8cm인 정규분포를
   따른다고 한다. 키가 160cm 이하인 학생들의 확률을 구하라.
   > 평균 170cm, 표준편차 8cm 인 정규 분포로, 160cm 이하일 확률은 0.10565 이다.



* 평균이 200이고 표준편차 8인 제품의 규격이 185~215 일 때, 이 제품에 대한 양품률을
   구하라.
    > 평균 200, 표준편차 8인 표준정규 분포로 185~215 일 확률은 0.93921 이다.

연속형 확률분포 (Continuous Probability Distribution)


연속확률변수 (continuous random variable)

일정한 실수구간 내에서 연속적인 값을 취하는 확률변수이다.
예를 들면, 남한강에 새로운 다리를 세우기 위해 남한강의 수심을 측정한다고 하자.
남한강의 수심은 최저 수심에서 최고 수심 사이의 모든 값을 가지게 되므로 연속확률
변수이다.

연속확률분포 (continuous probability distribution)

연속확률분포(함수)는 모든 x값에 대하여 0 이상의 값을 가져야 하고 전체를 적분하면 1
이 되어야 한다.





확률밀도함수 (pdf: probability density function)

연속확률변수(continuous random variable) X가 어떤 구간 내에서 취할 수 있는 무수한 값
x들에 대해서 확률을 대응시키는 함수를 말한다. 연속확률변수의 경우에는 어떤 특정한
값에 대한 확률(=0)은 구할 수 없어 아래에 보이는 것처럼 구간(interval)에 속하는 넓이를
적분하여 확률을 구하게 된다.


기대값과 분산 (expected value and variance)




가장 많이 사용되는 다섯가지 연속형 확률분포에 대하여 분포의 형태 및 확률값을 쉽게 볼 수 있도록 하였습니다.

분포의 종류:

⊙ 정규분포 (Normal Distribution) 
t 분포 (t-Distribution)
카이스퀘어분포 (Chi-square Distribution)
F 분포 (F Distribution)
와이블분포 (Weibull Distribution)

포아송 분포 (Poisson distribution)

시간, 면적 등 지정된 단위 구간에서 확률변수 X (단위 사상의 발생 횟수)가 나타내는 분포임.
⊙ 어느 특정지역에서 하루 동안 발생하는 교통사고 건 수.
⊙ 회사 교환대에 10분 동안 걸려오는 전화의 수.


포아송 확률변수의 조건

⊙ 구간마다 발생하는 사상은 서로 독립이다.
⊙ 사상의 발생 확률은 구간의 길이에 비례한다.
⊙ 아주 작은 구간에서 두 번 이상의 사상이 발생할 확률은 0 이다.



확률질량함수 (pmf: probability mass function)







기대값과 분산 (expected value and variance)






포와송 분포 예제

* H 회사교환대에는 시간당 평균 60 회의 전화가 걸려온다고 한다. 5분동안 7 회의 전화가
   걸려올 확률을 구하라.
    > 5 분간 평균 5 인 포와송 분포로, 7 회 걸려올 확률은 0.10444 이다.















 
* 어떤 작업장에 투입되는 부품 중 불량품의 수는 일일 평균 6 개인 포아송분포를 따를 때,
   하루 동안 이 작업장에 들어오는 불량품이 8 개 이상일 확률은 구하라.
    > 하루 평균 6 인 포와송 분포로, 불량품이 8 개 이상일 확률은 0.25585 이다.

초기하 분포 (Hypergeometric distribution)

크기 N인 유한 모집단(성공 수 M, 실패 수 N-M)에서 비복원으로 n개의 표본을 취할 때
확률변수 X (표본내 성공횟수) 가 나타내는 분포를 말한다.

확률질량함수 (pmf: probability mass function)



기대값과 분산 (expected value and variance)








초기하 분포 예제

* 전체 52장인 카드(붉은 색 26장, 검은 색 26장)에서 10장을 뽑을 때, 붉은 색일 7장일
   확률을 구하라.
   > 모집단 52, 모집단내 성공횟수 26, 표본수 10 인 초기하 분포로, 표본내 성공횟수가
       7 인 확률은 0.10811 이다.






* 불량율이 2%이고 크기가 1,000개인 LOT에서 50개의 시료를 추출할 때, 불량개수가 1개
   이하일 확률을 구하라.
   > 모집단 1,000, 모집단내 실패횟수 20, 표본수 50 인 초기하 분포로, 표본내 실패횟수가
       0~1 인 확률은 0.73604  이다.

음이항 분포 (Negative Binomial distribution)

베르누이 시행을 미리 정한 성공횟수 r 회가 될 때까지 반복 시행할 때 확률변수 X (실패횟수
또는 시행횟수)가 나타내는 분포를 말한다.

확률질량함수 (pmf: probability mass function)

기대값과 분산 (expected value and variance)






음이항 분포 예제

* 동전을 앞면이 2회 나올 때까지 던질 때, 뒷면이 5회 나올 확률을 구하라.
   > 성공횟수 2, 성공확률 0.5 인 음이항 분포로, 2회 성공전 실패횟수가 5 번일 확률은
       0.04688 이다.















* 52장 카드에서 하트가 3장 나올 때까지 뽑을 때, 10장 이하로 뽑을 확률을 구하라.
   > 성공횟수 3, 성공확률 0.25 인 음이항 분포로, 3장 성공까지 시행횟수가 10 번 이하일
      확률은 0.47441 이다.




베르누이 분포 (Bernoulli distribution)

베르누이 시행 (Bernoulli trial, Bernoulli experiment)

시행 결과가 "성공(예)" 또는 "실패(아니오)"의 두 개의 가능한 결과 가운데 하나가 나오는
실험으로, 매 시행 마다 성공확률이 같고 독립적으로 이루어지는 시행을 말한다.
예, 동전의 앞면이 위를 향하는가, (성공: 앞면이 위, 실패: 뒷면이 위)
      주사위의 눈이 3 이상인가, (성공: 눈이 3 이상, 실패: 눈이 2 이하) 등과 같이 가능한
      결과가 두가지인 것.

베르누이 시행 조건

⊙ 각 시행은 두가지 결과(성공 또는 실패) 중 한 가지만 나타난다. 
⊙ 각 시행은 서로 독립이다. 
⊙ 각 시행의 성공확률은 p로 동일하다.


확률질량함수 (pmf: probability mass function)

확률변수 X를 베르누이 실행의 결과라 하면, 즉 성공이면 X=1, 실패이면 X=0 이다.
이 경우 확률변수 X의 확률질량함수는 다음과 같고, 베르누이 분포(Bernoulli distribution)라
한다.







기대값과 분산 (expected value and variance)

2011년 6월 30일 목요일

이항분포 (Binomial distribution)


베르누이 시행을 n번 반복 시행할 때 확률변수 X (성공횟수)가 나타내는 분포를 말한다.



이항실험의 조건

⊙ 베르누이 시행을 n번 반복한다. 
n번의 시행은 독립적으로 한다. 
확률변수 X는 n번 시행중에서 성공횟수를 나타낸다.

이항 분포의 특징

⊙ 모수인 시행횟수(No of Trials)와 성공확률(Success Probability)로 분포의 모양이 정해짐. 
⊙ 시행횟수가 매우 크고, 성공확률이 작은 경우 이항 분포는 포아송 분포로 근사 가능.



확률질량함수 (pmf: probability mass function)











기대값과 분산 (expected value and variance)
 






이항 분포 예제
 
* 타율이 3할인 야구선수가 열다섯 번 타석에 나와 다섯 번 이상 열번 이하의 안타를 칠
   확률을 구하라.
   > 시행횟수 15, 성공확률 0.3 인 이항 분포로, 5~10 번 성공확률은 0.48384 이다.




 













* 자유투 성공률이 85%인 농구선수가 3점 슛중 반칙을 얻어 세 번의 자유투를 얻었다. 모두
   성공시킬 확률을 구하라.
   > 시행횟수 3, 성공확률 0.85 인 이항 분포로, 3 번 성공확률은 0.61413 이다.

이산형 확률분포 (Discrete Probability Distribution)

이산확률변수 (discrete random variable)

이산확률변수는 셀 수 있는 정수값을 취하는 확률변수이다.
예를 들면, 동전을 던질 때 앞면(head)이 나오는 횟수를 센다고 하자.
앞면의 횟수는 예상할 수 없는 순서로(random process) 나오고 그 횟수는 0과 +무한대
사이의 정수로 나오므로 동전의 앞면의 횟수는 이산확률변수이다.

이산확률분포 (discrete probability distribution)

이산확률분포(함수)는 모든 x값에 대하여 0 이상 1 이하의 값을 가져야 하고 전체를
합하면 1 이 되어야 한다.





확률질량함수 (pmf: probability mass function)

이산확률변수 X가 취할 수 있는 각 실수값 x에 확률을 대응시키는 함수를 일컷는데
모든 값이 그래프 위에서 수직선의 높이(질량)로 표현될 수 있어 질량함수라 부른다.

기대값과 분산 (expected value and variance)







이산형 확률분포중 가장 많이 사용되어지는 아래 네가지 분포에 대하여 보여줍니다.

분포의 종류: 

⊙ 이항분포 (Binomial Distribution) 
⊙ 음이항분포 (Negative Binomial Distribution)
초기하분포 (Hypergeometric Distribution)
⊙ 포와송분포 (Poisson Distribution)