Beta-jakauma

Beta-jakauma
	Tiheysfunktio;
	Kertymäfunktio;
Merkintä
Parametrit
Määrittelyjoukko
Tiheysfunktio
Kertymäfunktio
Odotusarvo
Moodi
Varianssi
Vinous
Huipukkuus
Entropia
Momentit generoiva funktio
Karakteristinen funktio	(katso hypergeometrinen funktio)
Fisherin informaatiomatriisi

Beta-jakauma^[1] eli $\beta -$ jakauma^[2] on todennäköisyyslaskennassa ja tilastotieteessä jatkuvan satunnaismuuttujan todennäköisyysjakauma, jota käytetään bayesilaisessa todennäköisyyslaskennassa. Koska Beta-jakaumaa voi parametrisoida monella eri tavalla, sitä voidaan kutsua jakaumaperheeksi. Sen avulla voidaan esittää lähes kaikki äärelliselle välille konsentroituneet jakaumat.^[1]^[2]

Jos satunnaismuuttuja $X$ on Beta-jakautunut parametreillä $\alpha$ ja $\beta$ , merkitään se yleensä

X\sim Beta(\alpha ,\beta )

^[1]

\sim Be(\alpha ,\beta )

\sim \beta _{\alpha ,\beta }.

Todennäköisyysjakauma

Satunnaismuuttujalla $X$ , joka on Beta-jakautunut ja jolla perusjoukko on $\Omega =$ [0,1], on kaksi positiivista parametria $\alpha$ ja $\beta$ . Niiden avulla Beta-jakauman tiheysfunktio määritellään

f_{X}(x)={\frac {1}{B(\alpha ,\beta )}}x^{\alpha -1}(1-x)^{\beta -1},

^[1]

missä niin sanottu beta-funktio on

B(\alpha ,\beta )=\int _{0}^{1}t^{\alpha -1}(1-t)^{\beta -1}dt={\frac {\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}},

^[1]

jossa $\Gamma (t)$ taas on gammafunktio. Beta-funktion tarkoituksena on "normalisoida" beta-jakauma niin, että sen tiheysfunktion määrätty integraali koko reaalialueen yli on tasan yksi.^[3]

Toisinaan joskus parametrien arvoista vähennetään yksi ( $\scriptstyle \alpha '=\alpha -1$ ja $\scriptstyle \beta '=\beta -1$ ), jotta tiheysfunktion ja momenttifunktion kaavat yksinkertaistuisivat hieman.^[4]

Beta-jakauman tiheysfunktiolla on seuraavanlaisia ominaisuuksia:^[1]

$f_{X}(x)>0$ kaikilla $x\in [0,1]$
Jos $\alpha >1$ ja $\beta =1$ , niin $f_{X}(x)$ on aidosti kasvava ja sen maksimikohta on välin päätepisteessä $x=1.$
Jos $\alpha =1$ ja $\beta >1$ , niin $f_{X}(x)$ on aidosti vähenevä ja sen maksimikohta on välin päätepisteessä $x=0.$
Jos $\alpha >1$ ja $\beta >1$ , niin $f_{X}(x)$ on yksihuippuinen ja sen maksimikohta on välin sisäpisteessä $x={\frac {\alpha -1}{\alpha +\beta -2}}.$
Jos $\alpha <1$ ja $\beta <1$ , niin $f_{X}(x)$ on U:n muotoinen ja sillä on lokaalit maksimikohdat on välin päätepisteissä $x=0$ ja $x=1.$
$f_{X}(x)$ on symmetrinen, jos $\alpha =\beta .$

Beta-jakauman kertymäfunktion lauseketta ei ole mahdollista kirjoittaa eksplisiittiseen muotoon, koska sen tiheysfunktion integraalifunktiota ei voi kirjoittaa lausekkeeksi alkeisfunktioiden avulla. Ne onkin tapana esittää vain numeerisessa muodossa aivan kuten toimitaan normaalijakaumassakin.^[1]

Tunnusluvut ja momentit

Momenttifunktio

Momenttifunktio eli momentit generoiva funktio saadaan määritelmästä

M(t)=E(e^{tX})={\frac {1}{B(\alpha ,\beta )}}\int _{0}^{1}e^{tx}x^{\alpha -1}(1-x)^{\beta -1}\,dx.

Sen avulla voidaan määritellä origomomentit ja keskusmomentit. Origomomenttien yleinen muoto on

\mu _{n}=E(X^{n})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +n)}{\Gamma (\alpha +\beta +n)\Gamma (\alpha )}},

^[4]

ja koska gammafunktiolla on $\Gamma (\alpha +1)=\alpha \Gamma (\alpha )$ , siitä saadaan ensimmäiset momentit

E(X)=E(X^{1})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +1)}{\Gamma (\alpha +\beta +1)\Gamma (\alpha )}}={\frac {\Gamma (\alpha +\beta )\alpha \Gamma (\alpha )}{(\alpha +\beta )\Gamma (\alpha +\beta )\Gamma (\alpha )}}={\frac {\alpha }{\alpha +\beta }}

ja

E(X^{2})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +2)}{\Gamma (\alpha +\beta +2)\Gamma (\alpha )}}={\frac {\Gamma (\alpha +\beta )(\alpha +1)\alpha \Gamma (\alpha )}{(\alpha +\beta +1)(\alpha +\beta )\Gamma (\alpha +\beta )\Gamma (\alpha )}}={\frac {\alpha (\alpha +1)}{(\alpha +\beta )(\alpha +\beta +1)}}.

Keskusmomenttien yleinen muoto on

\mu '_{n}=E((X-\mu )^{n})=\left(-{\frac {\alpha }{\alpha +\beta }}\right)^{n}\cdot {}_{2}F_{1}\left(\alpha ,-n;\alpha +\beta ;{\frac {\alpha +\beta }{\alpha }}\right),

missä ${}_{2}\!F_{1}$ on hypergeometrinen funktio.^[4]

Ensimmäinen origomomentti voidaan laskea myös suoraan

\mu =E(X)=\int _{0}^{1}xf_{X}(x)\,dx=\int _{0}^{1}x{\frac {1}{B(\alpha ,\beta )}}x^{\alpha -1}(1-x)^{\beta -1}\,dx

={\frac {1}{B(\alpha ,\beta )}}\int _{0}^{1}x^{\alpha }(1-x)^{\beta -1}\,dx={\frac {1}{B(\alpha ,\beta )}}B(\alpha +1,\beta )

={\frac {\Gamma (\alpha +1)\Gamma (\beta )}{\Gamma (\alpha +\beta +1)}}\cdot {\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}={\frac {\alpha \Gamma (\alpha )\Gamma (\beta )}{(\alpha +\beta )\Gamma (\alpha +\beta )}}\cdot {\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}={\frac {\alpha }{\alpha +\beta }}.

^[1]

Tunnuslukuja

Jakauman odotusarvo saadaan ensimmäisestä origomomentista

\mu =\operatorname {E} (X)={\frac {\alpha }{\alpha +\beta }}.

^[4]

Sen varianssi on taas suoraan toinen keskusmomentti

\mu '_{2}=\operatorname {Var} (X)=\sigma ^{2}={\frac {\alpha \beta }{(\alpha +\beta )^{2}(\alpha +\beta +1)}}.

^[3]^[4]

Jakauman tiheysfunktion vinous määritetään kahden keskumomentin avulla

g_{1}={\frac {\mu '_{3}}{{\mu '}_{2}^{3/2}}}={\frac {2(\beta -\alpha ){\sqrt {\alpha +\beta +1}}}{(\alpha +\beta +2){\sqrt {\alpha \beta }}}}.

^[3]^[5]^[4]

Vinous on nolla, mikä näkyy tasajakauman tiheysfunktion kuvaajasta, joka on täysin symmetrinen.

Jakauman huipukkuus määritetään kahden keskusmomentin avulla

\gamma _{2}={\frac {{\mu '}_{4}}{{\mu '}_{2}^{2}}}-3={\frac {6[\alpha ^{3}+\alpha ^{2}(1-2\beta )+\beta ^{2}(\beta +1)-2\alpha \beta (\beta +2)]}{\alpha \beta (\alpha +\beta +2)(\alpha +\beta +3)}}.

^[3]^[6]^[4]

Negativinen huipukkuus näkyy tiheysfunktion kuvaajassa siten, että kuvaaja on "tasa- ja litteäpäinen" eikä terävää kärkeä esiinny ollenkaan.

Jakauman moodi sijaitsee välin [0,1] sisäpisteessä, kun $\alpha >1$ ja $\beta >1$

Mo={\frac {\alpha -1}{\alpha +\beta -2}}.

Jos $\alpha <1$ tai $\beta <1$ voi moodi sijaita välin päätepisteessä. Kun $\alpha =\beta =1$ on jakauma tasajakauma ja kaikki pisteet ovat moodi.^[3]

Esimerkkejä

Tarkastellaan toistokoetta, jonka yksittäisen kolikonheiton arvoksi voi tulla vain "kruuna" tai "klaava" todennäköisyyksillä $p$ ja $1-p$ . Heittojen kokonaismäärän ollessa $n=100$ , noudattaa saatujen kruunujen yhteismäärät $X$ binomijakaumaa $X\sim Bin(100,p)$ . Jos halutaan selvittää "kruunan" todennäköisyyttä $p$ , kun saadaan $k=60$ "kruunaa", on se Beta-jakautunut $p\sim Beta(61,41)$ .^[7]

Edellinen ongelma on perinteisesti ratkaistu käyttäen normaalijakaumaa, mutta Beta-jakauma antaa silloin oikean tuloksen, kun se määritellään

p\sim Beta(k+1,n-k+1).

Normaalijakauma antaa harhaisen tuloksen, mikäli toistojen lukumäärä $n$ on pieni ja suhde $k/n$ on lähellä arvoa 0 tai 1.^[7]

Beta-jakaumaa tulisi käyttää normaalijakauman sijasta approksimoitaessa binomijakaumaa epäsymmetrisissä tiheysjakauman tilanteissa. Esimerkiksi epäsymmetrisessä ja kahta arvoa antavassa satunnaistapauhtumassa kannattaa käyttää diskreetin binomijakauman approksimoimiseksi jatkuvaa Beetta-jakaumaa. Yleensä binomijakaumaa approksimoidaan normaalijakaumalla, mutta se ei toimi kunnolla, kun toista arvoa esiintyy tuntuvasti enemmän kuin toista.^[7]

Beta-jakaumaa voidaan käyttää arvioitaessa tasajakaumien $U_{i}\sim U(0,1)$ arvoja. Arvotaan n satunnaismuuttujalle $U_{i}$ arvot $U_{1},$ $U_{2}$ $,...,$ $U_{n}$ . Arvot lajitellaan suuruusjärjestykseen, jolloin arvo merkitään uudella tavalla $U_{(i)},$ kun se on järjestyksessä i:nnes. (eli $U_{(1)}$ < $U_{(2)}$ < ... < $U_{(n)}$ ). Silloin arvo $U_{(k)}\sim Beta(k,n+1-k)$ kun $k=1,2,...,n$ .^[8]

Muut jakaumat

Beta-jakaumasta saadaan tasajakauma, mikäli parametrit ovat molemmat yksi

X\sim Beta(1,1)\sim U(0,1).

^[2]

Lähteet

↑ ^a ^b ^c ^d ^e ^f ^g ^h Mellin, Ilkka: Todennäköisyysjakaumat, s. 407−410, luentomonisteesta Todennäköisyyslaskenta, Aalto-yliopisto, 2006
↑ ^a ^b ^c Rahiala, Markku: Satunnaismallien teoria (Arkistoitu – Internet Archive), s. 21−22, Oulun yliopisto, 2002
↑ ^a ^b ^c ^d ^e Johnson, Paul & Beverlin, Matt: Beta Distribution, 2013
↑ ^a ^b ^c ^d ^e ^f ^g Weisstein, Eric W.: Beta Distribution (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ Weisstein, Eric W.: Skewness (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ Weisstein, Eric W.: Kurtosis (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
↑ ^a ^b ^c Stich, Slater: Use the Beta Distribution
↑ Laurent, Stéphane: The Beta distribution also appears as an order statistic...

Aiheesta muualla

Todennäköisyysjakaumat

Diskreettejä jakaumia	Bernoullin jakauma Binomijakauma Geometrinen jakauma Hypergeometrinen jakauma Negatiivinen binomijakauma Poissonin jakauma
Jatkuvia jakaumia	Beta-jakauma Cauchy-jakauma Eksponenttijakauma F-jakauma Gamma-jakauma Khii toiseen -jakauma Log-normaalijakauma Normaalijakauma Pareto-jakauma Studentin t-jakauma Tasajakauma Weibull-jakauma
Moniulotteisia jakaumia	Dirichlet-jakauma Moniulotteinen Studentin t-jakauma Multinomijakauma Multinormaalijakauma

[mellin407-1] ↑ ^a ^b ^c ^d ^e ^f ^g ^h Mellin, Ilkka: Todennäköisyysjakaumat, s. 407−410, luentomonisteesta Todennäköisyyslaskenta, Aalto-yliopisto, 2006

[oulu-2] Rahiala, Markku: Satunnaismallien teoria (Arkistoitu – Internet Archive), s. 21−22, Oulun yliopisto, 2002

[jb-3] Johnson, Paul & Beverlin, Matt: Beta Distribution, 2013

[BetaDistribution-4] ↑ ^a ^b ^c ^d ^e ^f ^g Weisstein, Eric W.: Beta Distribution (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[Skewness-5] Weisstein, Eric W.: Skewness (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[Kurtosis-6] Weisstein, Eric W.: Kurtosis (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

[stich-7] Stich, Slater: Use the Beta Distribution

[lau-8] Laurent, Stéphane: The Beta distribution also appears as an order statistic...

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]