Since 2004.11.5


by iiwi2
カレンダー
S M T W T F S
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30

勉強したよ、。

b0058868_22342572.jpg
やっと、解決しました。
前回の記事の正解は「0.0000000865%、(約11億5千万分の1)」。<おそらく、。

結局、同じ等に複数枚当たる場合を考えなきゃいけないのが、最大の関門でした。

n枚のくじにr枚の当たりくじが含まれている時、A等、B等、C等、…に当選する確率をそれぞれPA、PB、PC…、各等の当選枚数をa、b、c、…、(r=a+b+c+…、)とすると、確率Pは。

P(X)=nCr*{PA^(a)*PB^(b)*PC^(c)....}*q^(n-r)

q=1-(PA+PB+PC... ) :ハズレになる確率

1等から4等まで各1枚ずつ当選する時、
P=350C4*(1/500000)*(1/50000)*(1/5000)*(1/50)*{q^(350-4)}
( q=1-{(1/500000)+(1/50000)+(1/5000)+(1/50)} )

求めるのは、1等から4等までに当選する確率なので、それぞれの等に複数枚当選することを考慮しないといけなくなりました。実際、4等は4枚当選する確率が一番高くなります。(上図)

1等から4等まで各1枚ずつ当選する確率は
8.37E-11

同様に、1等から3等まで各1枚ずつ、4等のみ4枚当選する確率は
1.39E-10

なので、1、2、3等に1枚ずつ、4等は1枚から30枚あたる場合の総和を求めます。(13枚以上くらいから、意味はなくなりますが、Mac上なのでついでに、)。同様に3等(1/5000)について2枚以上当選する場合、。2等について、1等について、複数枚当選する場合、を考えます。

そうやって、求めた値が「0.0000000865%、(約11億5千万分の1)」。

もうすこし、いろんな場合を考えた方がいいのかもしれせんが、このへんでご勘弁を、。(^^;;

もっと簡単に概算する方法があるのかもしれないけど、分かりませんでした。
確率っていろんな場合を想定しなといけないので、むずかしいですよね。身近にある本にも、ずばりの記述がみつからなかったし、、おとなになると正解を教えてくれる人がいないので、困りもんです。ちゃんと勉強していなかったのが、こういうときにバレるんでしょうね、。orz

この週末をついやした結果です、ので、正解だとうれしい、。

【2.17 追記】概算方法について考察しました。

P(1,2,3,4)=P(1)/p*P(2)/p*P(3)/p*P(r) ---(iv)
(P(r)=350Cr*p^(r)*q^(n-r) 、p=10111/500000=0.0202 , q=1-p)




正規分布を使う方法とポアソン分布を使う方法がありました。

まず、。
確率変数Xについて、Xの平均E(X)、分散σ^2(X)は
E(X)=n*p , σ^2(X)=n*p*q , P(X)=nCx*p^(x)*{q^(n-x)}
nは個数、pは確率、q=1-p。

ラプラスの定理。
『確率変数Xが二項分布B(n,p)にしたがう時、nがおおきければ(n≧100)、Xは近似的に正規分布N(np,npq)にしたがうとみなせる。(q=1-p)』

ので、正規分布をつかってみます。


くじの枚数n=350、1等に当たる確率をP(1)=1/500000、2等に当たる確率をP(2)=1/50000、3等に当たる確率をP(3)=1/5000、4等に当たる確率をP(4)=1/50とします。
何等かにかぎらずくじにあたる確率pは、

p=P(1)+P(2)+P(3)+P(4)=10111/500000=0.0202

くじの当選枚数をr(0≦r≦350)とすると、どれかのくじにあたる確率P(r)は、

P(r)=350Cr*p^(r)*q^(n-r) ---(i)

つぎに、1等から4等までで、それぞれ複数枚に当選する事があるかどうかを考えてみます。
複数枚当たるというのは、E(X)≧2の場合ですので、4等以外は1枚ずつ当選すると考えてさしつかえなさそうです。
そこで、1等から4等までのすべてに当選する確率P(1,2,3,4)は、

P(1,2,3,4)=350C3*P(1)*P(2)*P(3)*(350-3)C(r-3)*p^(r-3)*q^(n-r)
=P(1)*P(2)*P(3)*p^(-3)*350Cr*p^(r)*q^(n-r)
=P(1)*P(2)*P(3)*p^(-3)*P(r)

となります。
1等から4等までのすべてに当選するにはくじに4枚以上当選しないといけないので、ラプラスの定理をつかってP(r≧4)を求めます。

E(r)=n*p=350*0.0202=0.707
σ(r)=(n*p*q)^(1/2)=(350*0.0202*0.9798)^(1/2)=2.63

P(r≧4)=(r-E(r)/σ(r))=Φ(1.36) (r=3.5 : r≧4をもとめるので、。)

正規分布表をつかうと、P(r≧4)=0.913 ---(ii)

∴P(1,2,3,4)=P(1)*P(2)*P(3)*p^(-3)*0.913=0.0000000008861
 =0.00000008861% ---(iii)

と、はじめにもとめた答えと同等になりました。

(iii)式は以下のようにかけます。

P(1,2,3,4)=P(1)/p*P(2)/p*P(3)/p*P(r) ---(iv)

もし、手元に正規分布表がなかったら、、
正規分布の山を2等辺3角形にみたてて、当選が3枚以下の確率P(r≦3)を概算します。
このとき、正規分布の山の三角形が底辺が2*E(r)、面積1とすると、当選が3枚以下の確率P(r≦3)は、

P(r≦3)=0.5*(3/7.07)^2= 0.09

なので、
P(r≧4)≒1-0.09=0.91

となり、(ii)とほぼ同じになります。<たまたま?

ここで疑問になるのが、(iv)式には枚数が影響していない事。
ラプラスの定理を使う前提として、n≧100というのがありましたが、100枚をこえると、(iv)式で間に合うのか?

ここで、もう少し勉強すると、『ポアソン分布』がでてきました。
『離散的確率変数Xのとり値が、
X=0, 1, 2, 3, …,n ,…
で、その各値rについて
P(X=r)=m^r*exp(-m)/r!
のとき、Xの確率分布をポアソン分布といい、Xはポアソン分布P(m)に従うと言う。』

『確率変数Xが二項分布B(n,p)に従って、かつ、nが大きくpが0に近い値で、0<n*p≦5のとき、Xは近似的にポアソン分布P(m) (m=np)に従う。

nCr*p^r*q^(n-r)≒m^r*exp(-m)/r!』

今回、n=350、p=0.0202なのでn*p≧5となりますが、たとえば、nが250以下になれば、ポアソン分布が使えそうです。
また、4等を無視して1、2、3等のみのくじと考えてみると、

p=P(1)+P(2)+P(3)=0.0002

となり、ポアソン分布が使えます。
くじが4枚あたる確率P(X=4)は

m=n*p=0.07, r=4

ここで、ポアソン分布表を使いたいのですが、ポアソン分布表にはm=0.07はありませんので、m^r*exp(-m)/r!を計算しますと、

P(X=4)=0.000000932782317

(iv)式を変形すると、

P(1,2,3,4)=P(1)/p*P(2)/p*P(X=4) ---(iv)
=9.3e-10

と、ほぼ、同等の値が得られました。

なので、0<n*p≦5の範囲内でポアソン分布をうまく使えば良いのだと思います。

こういう分野を『推測統計』と言うそうです。めでたしめでたし、。(^^;;
[PR]
by iiwi2 | 2006-02-13 22:59 | 日記