Cauchy-jakauma
Cauchy-jakauma (Cauchyn jakauma) on Augustin Cauchyn mukaan nimetty jatkuva todennäköisyysjakauma. Varsinkin fysikaalisissa sovelluksissa sitä nimitetään myös Lorentzin jakaumaksi (Hendrik Lorentzin mukaan),[1] Cauchyn–Lorentzin jakaumaksi tai Breitin–Wignerin jakaumaksi. Yksinkertaisinta Cauchy-jakaumaa sanotaan standardiksi Cauchy-jakaumaksi. Sen tiheysfunktio on
Tiheysfunktio | |
Kertymäfunktio | |
Parametrit | lokaatio (reaaliluku) γ > 0 skaala (reaaliluku) |
---|---|
Määrittelyjoukko | |
Tiheysfunktio | |
Kertymäfunktio | |
Odotusarvo | ei ole |
Mediaani | |
Moodi | |
Varianssi | ei ole |
Vinous | ei määritelty |
Huipukkuus | ei määritelty |
Entropia | |
Momentit generoiva funktio | ei ole |
Karakteristinen funktio |
ja sen kertymäfunktio on arkustangenttifunktion muotoinen:
- .
Kahden standardin normaalisti jakautuneen satunnaismuuttujan suhde noudattaa standardia Cauchy-jakaumaa.[2]
Cauchy-jakauma on siitä erikoinen, että sillä ei ole odotusarvoa eikä varianssia. Tämän vuoksi eräät todennäköisyyslaskennan tärkeät tulokset kuten suurten lukujen laki ja keskeinen raja-arvolause eivät koske Cauchy-jakaumaa noudattavia satunnaismuuttujia. Koska sillä ei ole odotusarvoa, sillä ei ole myöskään momentit generoivaa funktiota.[3]
Cauchy-jakauma on yksi harvoista vakaista jakaumista, joiden tiheysfunktio voidaan ilmaista analyyttisesti; muita sellaisia ovat normaalijakauma ja Lévyn jakauma.
Historia
muokkaaMatemaatikot tutkivat Cauchy-jakauman muotoisia funktioita jo 1700-luvun alussa, mutta toisenlaisessa yhteydessä. Tuolloin niistä käytettiin nimitystä Agnesin noita.[1] Jakauman nimestä huolimatta ensimmäisen tutkielman sen ominaisuuksista jakaumana julkaisi ranskalainen matemaatikko Siméon Denis Poisson vuonna 1824; Cauchyn nimi liitettiin siihen vasta erään vuonna 1853 käydyn akateemisen väittelyn yhteydessä.[4] Jakauman nimi on siis esimerkki Stiglerin lain toteutumisesta. Poisson totesi, että jos otetaan keskiarvo tätä jakaumaa noudattavista havainnoista, se ei havaintojen lukumäärän kasvaessa suppene mitään äärellistä lukua kohti. Niinpä Laplace oli tehnyt virheen soveltaessaan keskeistä raja-arvolausetta tällaiseenkin jakaumaan, sillä lause edellyttää äärellistä odotusarvoa ja varianssia. Poisson ei kuitenkaan pitänyt asiaa kovin tärkeänä, toisin kuin Bienaymé, joka myöhemmin kävi Cauchyn kanssa pitkällisen väittelyn asiasta.
Tilanteita, joissa Cauchy-jakauma esiintyy
muokkaaNormaalisti jakautuneiden satunnaismuuttujien suhde
muokkaaJos U ja V ovat kaksi riippumatonta normaalisti jakautunutta satunnaismuuttujaa, joiden odotusarvo on 0 ja varianssi 1, niiden suhde U/V noudattaa standardia Cauchy-jakaumaa. [2]
Suorien leikkauspisteen jakauma
muokkaaOletetaan, että tasolla jonkin x-akselin ulkopuolella olevan pisteen kautta piirretään satunnaisesti valittu suora siten, että tämän suoran suuntakulma on tasaisesti jakautunut välille -π/2 ... π/2. Tällöin sen pisteen sijainti, jossa tämä suora leikkaa x-akselin, noudattaa Cauchy-jakaumaa.[5]
Tämä voidaan todistaa seuraavasti:
Olkoon θ kulma, jonka y-akselilla olevan pisteen (0,b) kautta kulkeva suora muodostaa y-akselin kanssa. Jos suora leikkaa x-akselin pisteessä (x0, 0), on
- ,
ja
- ,
jolloin jos kulma θ on tasaisesti jakautunut välille -π/2; ... π/2;. Leikkauspisteen jakauman kertymäfunktion ilmaisee todennäköisyys, että pisteen x-koordinaatti on pienempi kuin annettu x0. Näin tapahtuu, jos
eli jos
mutta koska θ on tasaisesti jakautunut välille (-π, π), se saa mitä tahansa tällä välillä olevaa arvoa a pienemmän arvon todennäköisyydellä
- ,
ja näin ollen arvoa θ0 pienemmän arvon todennäköisyydellä
- ,
sillä θ saa nollaa pienemmän arvon todennäköisyydellä 1/2.
Kyseisen leikkauspisteen sijainnin x-koordinaatin arvo on siis satunnaismuuttuja, jonka kertymäfunktio on
mikä on juuri Cauchy-jakauman Cauchy (0,1) kertymäfunktio.
Jakauman tiheys- ja kertymäfunktio
muokkaaTiheysfunktio
muokkaaCauchy-jakauman tiheysfunktio on
missä parametri x0 (lokaatioparametri) osoittaa jakauman huipun sijainnin ja γ (skaalaparametri) osoittaa jakauman leveyden, tai tarkemmin sanottuna, millä etäisyydellä jakauman huipusta tiheysfunktion arvo on puolet tästä maksimiarvosta. Samalla γ on myös puolet jakauman ylä- ja alakvartiilien erotuksesta, ja sitä sanotaan joskus todennäköiseksi virheeksi. Augustin-Louis Cauchy käytti vuonna 1827 tästä tiheysfunktiosta sellaistakin muunnosta, jossa skaalaparametri oli infinitesimaalinen, ja täten hän tuli määritellyksi sen, mitä nykyisin sanotaan Diracin deltafunktioksi.
Tiheysfunktion suurin arvo eli jakauman amplitudi on
Siinä erikoistapauksessa, että x0 = 0 ja γ = 1 saadaan standardi Cauchy-jakauma, jonka tiheysfunktio on
Fysiikassa käytetään usein kolmiparametrista Lorentzin funktiota:
missä I on huipun korkeus. Tämä kolmiparametrinen Lorentzin funktio ei yleensä ole todennäköisyystiheysfunktio, sillä sen integraali ei ole 1 paitsi siinä erikoistapauksessa, että .
Kertymäfunktio
muokkaaCauchy-jakauman kertymäfunktio on:
ja sen kvantiilifunktio eli kertymäfunktion käänteisfunktio on
Tästä seuraa, että jakauman ala- ja yläkvartiilit ovat x0-γ ja x0+γ),
ja kvartiilien erotus näin ollen 2γ.
Cauchy-jakauman kvantiilifunktion derivaatta eli jakauman kvantiilitiheysfunktio on:
Jakauman differentiaalinen entropia määritellään sen kvantiilitiheysfunktion avulla:[6], nimittäin
Ominaisuuksia
muokkaaCauchy-jakauma on esimerkki jakaumasta, jolla ei ole odotusarvoa, varianssia eikä korkeampia momentteja. Sen sijaan sillä kyllä on hyvin määritelty moodi eli tiheysfunktion maksimikohta ja mediaani, jotka molemmat ovat suuruudeltaan x0. Jakauman tiheysfunktion kuvaaja on lisäksi symmetrinen tämän mediaanin suhteen ja muistuttaa muodoltaan normaalijakauman kuvaajaa eli Gaussin käyrää, mutta ei silti toteuta odotusarvon määritelmän ehtoja. Cauchy-jakauman tiheysfunktio lähestyy kummassakin päässä nollaa oleellisesti hitaammin kuin normaalijakauman; sanotaan, että sillä on paksummat "hännät".
Jos X1, ..., Xn ovat riippumattomia ja identtisesti jakautuneita satunnaismuuttujia, joista jokainen noudattaa standardia Cauchy-jakaumaa, niiden otoskeskiarvo (X1+ ... +Xn)/n noudattaa samaa standardia Cauchyn jakaumaa.[2] Tämä voidaan osoittaa laskemalla keskiarvon karakteristinen funktio:
missä on otoskeskiarvo. Keskeinen raja-arvolause ei siis päde Cauchy-jakaumalle, mutta sillä ei olekaan lauseen edellyttämää äärellistä varianssia, ja näin ollen tämä esimerkki osoittaa, että tämä todella on oleellinen edellytys, jota ei voida jättää huomioon ottamatta. Myöskään suurten lukujen laki ei koske Cauchy-jakaumaa, koska sillä ei ole odotusarvoa. Cauchy-jakauma on täysin vakaa jakauma.[7]
Standardi Cauchy-jakauma saadaan myös erikoistapauksena Studentin t-jakaumasta, kun vapausasteita on yksi.[3]
Kuten kaikkien muidenkin vakaiden jakaumien tapauksessa, se lokaatio-skaala-perhe, johon Cauchy-jakauma kuuluu, on suljettu sellaisten lineaaristen muunnosten suhteen, joiden kertoimet ovat reaalilukuja. Lisäksi jakaumaperhe on suljettu reaalikertoimisten lineaaristen frationaalisten muunnosten suhteen.[8]
Karakteristinen funktio
muokkaaOlkoonX Cauchy-jakautunut satunnaismuuttuja. Jakauman karakteristinen funktio on[3]
mikä on samalla tiheysfunktion Fourier-muunnos. Alkuperäinen todennäköisyystiheys voidaan esittää karakteristisen funktion avulla oleellisesti käyttämällä käänteistä Fourier-muunnosta:
On huomattava, että karakteristinen funktio ei ole differentioituva origossa: tämä vastaa sitä, että Cauchy-jakaumalla ei ole odotusarvoa.
Miksi odotusarvoa ja momentteja ei voida määrittää
muokkaaOdotusarvo
muokkaaJos todennäköisyysjakaumalla on tiheysfunktio f(x), sen odotusarvo on
Kysymys on nyt siitä, miten määritellään integraali molemmista päistä rajoittamattoman välin yli: onko se sama kuin
jokaisella mielivaltaisella reaaliluvulla a.
Jos ainakin toinen lausekkeen (2) yhteenlaskettavista on äärellinen, lausekkeet (1) ja (2) ovat yhtä suuret. Mutta Cauchy-jakauman tapauksessa edellinen näistä yhteenlaskettavista on miinus ääretön, jälkimmäinen plus ääretön, eikä niiden summaa voida laskea. Sen vuoksi lauseke (1) ei ole määritelty, eikä Cauchyn jakaumalla sen vuoksi ole odotusarvoa.[9]
Vaikuttaisi ehkä luonnolliselta käsittää lauseke (1) raja-arvoksi
- .
Tämä raja-arvo, niin sanottu Cauchyn perusarvo, on nolla. Mutta lausekkeen (1) voitaisiin yhtä hyvin tulkita tarkoittavan myös esimerkiksi raja-arvoa
joka ei ole nolla, mikä voidaan todeta suorittamalla integrointi.
Monet odotusarvoa koskevat todennäköisyyslaskennan tulokset kuten vahva suurten lukujen laki eivät tällaisissa tapauksissa päde.[9]
Korkeammat momentit
muokkaaCauchy-jakaumalla ei ole minkään asteen äärellisiä momentteja. Jotkin korkeammista raaoista momenteista sillä kyllä on, ja ne ovat äärettömiä, esimerkiksi raaka toinen momentti:
Järjestämällä lauseke uudestaan huomataan, että toinen momentti on oleellisesti vakion, tässä luvun 1, integraali äärettömän välin yli. Myös korkeammat parillisen potenssin raa'at momentit saavat arvon ääretön. Parittoman potenssin raakoja momentteja taas ei voida lainkaan määritellä. Ne nimittäin olisivat oleellisesti sama asia kuin lauseke , sillä lausekkeessa olevat kaksi integraalia, joista toinen vähennetään toisesta, ovat molemmat äärettömiä. Ensimmäinen raaka momentti on sama kuin jakauman odotusarvo, jota tässä tapauksessa ei siis myöskään voida määritellä. Tämä taas merkitsee, että jakaumalle ei voida määritellä myöskään keskeisiä momentteja eikä standardoituja momentteja, sillä ne kaikki määritellään odotusarvon avulla. Samasta syystä Cauchy-jakaumalla ei ole myöskään varianssia, sillä se on sama kuin toinen keskeinen momentti, vaikka sillä onkin toinen raaka momentti, joka on ääretön.
Korkeampia momentteja koskevat tulokset seuraavat Hölderin epäyhtälötä, jonka mukaan alempien momenttien hajaantuessa korkeammatkin momentit hajaantuvat.
Parametrien estimointi
muokkaaKoska Cauchyn jakauman parametrit eivät vastaa odotusarvoa ja varianssia, Cauchy-jakauman parametreja ei voida estimoida otoksen keskiarvon ja varianssin avulla.[10] Jos esimerkiksi otetaan Cauchy-jakauman mukaisesta aineistosta n otosta, tämän otoksen keskiarvo voidaan laskea:
Vaikka otoksen arvot xi keskittyvät lähelle mediaania x0, otoksen keskiarvo voi vaihdella yhä enemmän sitä mukaa kuin lisää otoksia poimitaan, koska on yhä todennäköisempää, että kohdataan tapauksia, jotka poikkeavat siitä paljon. Itse asiassa otosten keskiarvo noudattaa samaa jakaumaa kuin otokset itsekin, toisin sanoen suuren otoksen keskiarvo ei ole lainkaan parempi, joskaan ei huonompikaan arvio mediaanille x0 kuin mikään yksittäinen otokseen kuuluva havaintokaan. Samoin myös otoksen varianssi kasvaa yhä suuremmaksi, kun lisää otoksia poimitaan.
Siksi mediaanin x0 ja skaalaparametrin γ arvioimiseksi tarvitaan vahvempia menetelmiä. Muuan yksinkertainen keino on käyttää otoksen mediaania x0:n estimaattorina sekä ala- ja yläkrvartiilin erotusta estimaattorina γ:lle. Muitakin, tarkempia ja vahvempia menetelmiä on keksitty.[11][12] Esimerkiksi katkaistu keskiarvo otoksen järjestystilaston keskimmäisistä 24 prosentista tapauksia antaa x0:lle arvion tehokkaammin kuin koko otoksen mediaani.[13][14] Kun Cauchy-jakauma kuitenkin on ääripäistään "paksu" eli sen tiheysfunktio lähestyy kummassakin päässä vain hitaasti nollaa, arvion tehokkuus alenee, kun otoskoko ylittää 24 %.[13][14]
Parametrin x0 and γ arviointiin voidaan käyttää myös suurimman uskottavuuden estimointia. Se on yleensä kuitenkin hankalaa, koska sitä varten on ratkaistava korkeamman asteen polynomiyhtälö, ja sillä voi olla useita ratkaisuja, jotka vastaavat korkeamman asteen polynomiyhtälön juuret, ja sillä voi olla useita juuria, jotka vastaavat lokaaleja maksimikohtia.[15] Lisäksi vaikka suurimman uskottavuuden estimointi onkin asymptoottisesti tehokas, pienillä otoksilla se on melko tehoton.[16][17] Otoskoolla n Cauchy-jakauman logaritminen todennäköisyysfunktio on:
Maksimoimalla logaritminen todennäköisyysfunktio x0:n ja γ:n suhteen saadaan seuraava yhtälöryhmä:
On huomattava, että
on γ:n monotoninen funktio ja että ratkaisun γ täytyy toteuttaa epäyhtälö
Pelkän x0:n ratkaiseminen edellyttää 2n-1:nnen asteen polynomiyhtälön ratkaisemista,[15] ja pelkän γn ratkaiseminen n:nnen asteen polynomiyhtälön ratkaisemista (ensin γ2:n, sitten x0:n). Siksi yleensä onkin käytettävä tietokoneella suoritettavia numeerisen analyysin menetelmiä, olipa tarkoituksena ratkaista molemmat parametrit tai vain toinen niistä. Suurimman uskottavuuden estimoinnin etuna on asymptoottinen tehokkuus; x0:n estimointi otoksen mediaanin avulla on vain 81-prosenttisesti niin tehokas kuin sen estimointi suurimman uskottavuuden menetelmällä.[14][18] Katkaistun otoskeskiarvon menetelmä 24 prosentin järjestystilastolla on asymptoottisesti noin 88-prosenttisesti niin tehokas kuin x0:n estimointi suurimman uskottavuuden menetelmällä.[14] Menetelmiä voidaan myös yhdistää etsimällä keskimmäisten 24 prosentin järjestystilastolla x0 jokin alustava likiarvo, jota sitten parannetaan suurimman uskottavuuden estimaattoreilla soveltamalla Newtonin menetelmää.
Tämä artikkeli tai sen osa on tuotu vieraskielisestä lähteestä ja käännös on keskeneräinen. Voit auttaa Wikipediaa tekemällä käännöksen loppuun. |
Moniulotteinen Cauchy-jakauma
muokkaaSatunnaisvektorin X = (X1, ..., Xk)' sanotaan noudattavan moniulotteista Cauchy-jakaumaa, jos sen komponenttien jokainen lineaarikombinaatio Y = a1X1 + ... + akXk noudattaa Cauchy-jakaumaa. Toisin sanoen jokaisen vakiovektorin ja satunnaisvektorin X pistetulo a · X noudattaa tavallista (yksiulotteista) Cauchy-jakaumaa.[19] Moniulotteisen Cauchy-jakauman karakteristinen funktio on
missä x0(t) ja γ(t) ovat reaalifunktioita, joilla x0(t) on ensimmäisen asteen homogeeninen funktio ja γ(t) positiivinen homogeeninen ensimmäisen asteen funktio.[19] Täsmällisemmin sanottuna:[19]
kaikilla t.
Esimerkki bivariaattisesta Cauchy-jakaumasta saadaan lausekkeella:[20]
Vaikka tämä esimerkki ei olekaan analoginen kovariantin matriisin kanssa, voidaan todeta, että x ja y eivät ole riippumattomia.[20]
Analogisesti tavallisen yksiulotteisen tiheysfunktion kanssa myös moniulotteinen Cauchyn tiheysfunktio liittyy läheisesti moniulotteiseen Studentin jakaumaan. Jos viimeksi mainitun vapausasteluku on 1, kyseessä on sama kuin moniulotteisen Cauchy-jakauma. Ja k-ulotteisen Studentin jakauman tiheysfunktio yhdellä vapausasteella on:
Muunnosominaisuudet
muokkaa- Jos , niin
- Jos ja ovat riippumattomia, niin
- Jos , niin
- McCullaghin parametraatio Cauchy-jakaumalle: Jos Cauchy-jakauman ilmaiseminen kompleksiparametrin , voidaan märitellä, että X ~ Cauchy(ψ), jos X ~ Cauchy . Jos X ~ Cauchy(ψ) niin:
- ~ Cauchy
missä a,b,c ja d ovat reaalilukuja.
- Jos X ~ Cauchy(ψ) edellä esitetyn määritelmän mukaisessa mielessä, niin
- ~ CCauchy
- missä "CCauchy" on sirkulaarinen Cauchy-jakauma.
Suhde muihin jakaumiin
muokkaa- on sama kuin Studentin t-jakauma
- on sama kuin , ei-standardoitu Studentin t-jakauma
- Jos ja X ja Y ovat riippumattomia, niin
- Jos niin
- Jos X ~ Log-Cauchy(0, 1) niin ln(X) ~ Cauchy(0, 1)
- Cauchy-jakauma on rajatapaus tyypin 4 Pearsonin jakaumastalähde?
- Cauchy-jakauma on erikoistapaus tyypin 7 Pearsonin jakaumasta[21]
- Cauchy-jakauma on hyperbolisen jakauman singulaarinen raja-arvo
Lähteet
muokkaa- ↑ a b Earliest Known Uses of Some of the Words in Mathematics (C): Cauchy distribution jeff560.tripod.com. Viitattu 13.1.2016.
- ↑ a b c Pekka Tuominen, Pekka Norlamo: ”Cauchy-jakaumat”, Todennäköisyyslaskenta, osa 2, s. 429–432. Limes ry, 1978. ISBN 951-745-023-0.
- ↑ a b c Pekka Tuominen, Pekka Norlamo: ”Jakaumat pähkinänkuoressa”, Todennäköisyyslaskenta, osa 2, s. 622. Limes ry, 1978. ISBN 951-745-023-0.
- ↑ S. M. Stigler: ”Luku 18: Cauchy and the Witch of Agnesi”, Statistics on the Table. Harvard.
- ↑ Cauchy distribution Wolfram MathWorld. Eric W. Weisstein.
- ↑ Oldrich Vasicek: A Test for Normality Based on Sample Entropy. Journal of the Royal Statistical Society, Series B, 1976, 38. vsk, nro 1, s. 54–59.
- ↑ Campbell B. Read, N. Balakrishnan, Brani Vidakovic, Samuel Kotz: Encyclopedia of Statisical Sciences, 2. painos, s. 778. John Wiley & Sons, 2006. ISBN 978-0-471-15044-2.
- ↑ F. B. Knight: A characterization of the Cauchy type. Proceedings of the American Mathematical Society, 1976, 55. vsk, s. 130–135. doi:10.2307/2041858. JSTOR:2041858.
- ↑ a b Cauchy Distribution University of Alabama, Huntsville, Virtual Laboratories. Viitattu 13.1.2016.
- ↑ Illustration of instability of sample means statistics4u.info.
- ↑ Gwenda J. Cane: Journal of the American Statistical Association, 1974, 69. vsk, nro 345, s. 243–245. doi:10.1080/01621459.1974.10480163. JSTOR:2285535.
- ↑ Jin Zhang: A Highly Efficient L-estimator for the Location Parameter of the Cauchy Distribution. Computational Statistics, 2010, 25. vsk, nro 1, s. 97–105. doi:10.1007/s00180-009-0163-y. Artikkelin verkkoversio.[vanhentunut linkki]
- ↑ a b Thomas J. Rothenberg, Franklin M. Fisher, C. B. Tilanus: A note on the estimation from a Cauchy sample. Journal of the American Statistical Association, 1966, 59. vsk, nro 366, s. 460–463. doi:10.1080/01621459.1964.10482170.
- ↑ a b c d Daniel Bloch: A note on the estimation of the location parameters of the Cauchy distribution. Journal of the American Statistical Association, 1966, 61. vsk, nro 316, s. 852–855. doi:10.1080/01621459.1966.10480912. JSTOR:2282794.
- ↑ a b Thomas S. Ferguson: Maximum Likelihood Estimates of the Parameters of the Cauchy Distribution for Samples of Size 3 and 4. Journal of the American Statistical Association, 1978, 73. vsk, nro 73. doi:10.1080/01621459.1978.10480031. JSTOR:2286549.
- ↑ Gabriella V. Cohen Freue: The Pitman estimator of the Cauchy location parameter. Journal of Statistical Planning and Inference, 2007, 137. vsk, nro 6. doi:10.1016/j.jspi.2006.05.002. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
- ↑ Rand Wilcox: Introduction to Robust Estimation & Hypothesis Testing. Elsevier, 2012.
- ↑ V. D. Barnett: Order Statistics Estimators of the Location of the Cauchy Distribution. Journal of the American Statistical Association, 1966, 61. vsk, nro 316. doi:10.1080/01621459.1966.10482205. JSTOR:2283210.
- ↑ a b c Thomas S. Ferguson: A Representation of the Symmetric Bivariate Cauchy Distribution. The Annals of Mathematical Statistics, 1962. doi:10.1214/aoms/1177704357. JSTOR:2237894.
- ↑ a b Geert Molenberghs, Emmanuel Lesaffre: Non-linear Integral Equations to Approximate Bivariate Densities with Given Marginals and Dependence Function. Statistica Sinica, 1997, 7. vsk, s. 713–738. Artikkelin verkkoversio.
- ↑ N. L. Johnson, S. Kotz, N. Balakrishnan: ”Chapter 16”, Continuous Univariate Distributions, Volume 1. New York: Wiley, 1994.
Aiheesta muualla
muokkaa- Cauchy distribution Encyclopedia of Mathematics. Viitattu 13.1.2016.
- GNU Scientific Library – Reference Manual: 20.8: The Cauchy Distribution gnu.org. Viitattu 13.1.2016.
- Ratios of Normal Variables George Marsaglia. Viitattu 13.1.2016.
Diskreettejä jakaumia | |
---|---|
Jatkuvia jakaumia | |
Moniulotteisia jakaumia |