Cauchy-jakauma (Cauchyn jakauma) on Augustin Cauchyn mukaan nimetty jatkuva todennäköisyysjakauma. Varsinkin fysikaalisissa sovelluksissa sitä nimitetään myös Lorentzin jakaumaksi (Hendrik Lorentzin mukaan),[1] Cauchyn–Lorentzin jakaumaksi tai Breitin–Wignerin jakaumaksi. Yksin­kertaisinta Cauchy-jakaumaa sanotaan standardiksi Cauchy-jakaumaksi. Sen tiheysfunktio on

Cauchy-jakauma
Tiheysfunktio
Cauchyn jakaumien tiheysfunktioita Purppuranvärinen käyrä on standardi Cauchy-jakauma
Kertymäfunktio
Cauchy-jakauman kertymäfunktio
Parametrit lokaatio (reaaliluku)
γ > 0 skaala (reaaliluku)
Määrittelyjoukko
Tiheysfunktio
Kertymäfunktio
Odotusarvo ei ole
Mediaani
Moodi
Varianssi ei ole
Vinous ei määritelty
Huipukkuus ei määritelty
Entropia
Momentit generoiva funktio ei ole
Karakteristinen funktio

ja sen kertymäfunktio on arkustangenttifunktion muotoinen:

.

Kahden standardin normaalisti jakautuneen satunnaismuuttujan suhde noudattaa standardia Cauchy-jakaumaa.[2]

Cauchy-jakauma on siitä erikoinen, että sillä ei ole odotusarvoa eikä varianssia. Tämän vuoksi eräät toden­näköisyys­laskennan tärkeät tulokset kuten suurten lukujen laki ja keskeinen raja-arvolause eivät koske Cauchy-jakaumaa noudattavia satunnais­muuttujia. Koska sillä ei ole odotus­arvoa, sillä ei ole myöskään momentit generoivaa funktiota.[3]

Cauchy-jakauma on yksi harvoista vakaista jakaumista, joiden tiheysfunktio voidaan ilmaista analyyttisesti; muita sellaisia ovat normaalijakauma ja Lévyn jakauma.

Historia

muokkaa

Matemaatikot tutkivat Cauchy-jakauman muotoisia funktioita jo 1700-luvun alussa, mutta toisenlaisessa yhteydessä. Tuolloin niistä käytettiin nimitystä Agnesin noita.[1] Jakauman nimestä huolimatta ensimmäisen tutkielman sen ominaisuuksista jakaumana julkaisi ranskalainen matemaatikko Siméon Denis Poisson vuonna 1824; Cauchyn nimi liitettiin siihen vasta erään vuonna 1853 käydyn akateemisen väittelyn yhteydessä.[4] Jakauman nimi on siis esimerkki Stiglerin lain toteutumisesta. Poisson totesi, että jos otetaan keskiarvo tätä jakaumaa noudattavista havainnoista, se ei havaintojen lukumäärän kasvaessa suppene mitään äärellistä lukua kohti. Niinpä Laplace oli tehnyt virheen soveltaessaan keskeistä raja-arvolausetta tällaiseenkin jakaumaan, sillä lause edellyttää äärellistä odotus­arvoa ja varianssia. Poisson ei kuitenkaan pitänyt asiaa kovin tärkeänä, toisin kuin Bienaymé, joka myöhemmin kävi Cauchyn kanssa pitkällisen väittelyn asiasta.

Tilanteita, joissa Cauchy-jakauma esiintyy

muokkaa

Normaalisti jakautuneiden satunnaismuuttujien suhde

muokkaa

Jos U ja V ovat kaksi riippumatonta normaalisti jakautunutta satunnaismuuttujaa, joiden odotusarvo on 0 ja varianssi 1, niiden suhde U/V noudattaa standardia Cauchy-jakaumaa. [2]

Suorien leikkauspisteen jakauma

muokkaa

Oletetaan, että tasolla jonkin x-akselin ulkopuolella olevan pisteen kautta piirretään satunnaisesti valittu suora siten, että tämän suoran suuntakulma on tasaisesti jakautunut välille -π/2 ... ­π/2. Tällöin sen pisteen sijainti, jossa tämä suora leikkaa x-akselin, noudattaa Cauchy-jakaumaa.[5]

Tämä voidaan todistaa seuraavasti:

Olkoon θ kulma, jonka y-akselilla olevan pisteen (0,b) kautta kulkeva suora muodostaa y-akselin kanssa. Jos suora leikkaa x-akselin pisteessä (x0, 0), on

 ,

ja

 ,

jolloin jos kulma θ on tasaisesti jakautunut välille -π/2; ... π/2;. Leikkaus­pisteen jakauman kertymä­funktion ilmaisee toden­näköisyys, että pisteen x-koordinaatti on pienempi kuin annettu x0. Näin tapahtuu, jos

 

eli jos

 

mutta koska θ on tasaisesti jakautunut välille (-π, π), se saa mitä tahansa tällä välillä olevaa arvoa a pienemmän arvon toden­näköisyydellä

 ,

ja näin ollen arvoa θ0 pienemmän arvon toden­näköisyydellä

 ,

sillä θ saa nollaa pienemmän arvon toden­näköisyydellä 1/2.

Kyseisen leikkauspisteen sijainnin x-koordinaatin arvo on siis satunnaismuuttuja, jonka kertymä­funktio on

 

mikä on juuri Cauchy-jakauman Cauchy (0,1) kertymäfunktio.

Jakauman tiheys- ja kertymäfunktio

muokkaa

Tiheysfunktio

muokkaa

Cauchy-jakauman tiheysfunktio on

 

missä parametri x0 (lokaatioparametri) osoittaa jakauman huipun sijainnin ja γ (skaalaparametri) osoittaa jakauman leveyden, tai tarkemmin sanottuna, millä etäisyydellä jakauman huipusta tiheys­funktion arvo on puolet tästä maksimi­arvosta. Samalla γ on myös puolet jakauman ylä- ja ala­kvartiilien erotuksesta, ja sitä sanotaan joskus todennäköiseksi virheeksi. Augustin-Louis Cauchy käytti vuonna 1827 tästä tiheys­funktiosta sellaistakin muunnosta, jossa skaala­parametri oli infinitesimaalinen, ja täten hän tuli määritellyksi sen, mitä nykyisin sanotaan Diracin deltafunktioksi.

Tiheysfunktion suurin arvo eli jakauman amplitudi on

 

Siinä erikois­tapauksessa, että x0 = 0 ja γ = 1 saadaan standardi Cauchy-jakauma, jonka tiheysfunktio on

 

Fysiikassa käytetään usein kolmi­parametrista Lorentzin funktiota:

 

missä I on huipun korkeus. Tämä kolmi­parametrinen Lorentzin funktio ei yleensä ole toden­näköisyys­tiheys­funktio, sillä sen integraali ei ole 1 paitsi siinä erikois­tapauksessa, että  .

Kertymäfunktio

muokkaa

Cauchy-jakauman kertymäfunktio on:

 

ja sen kvantiilifunktio eli kertymä­funktion käänteisfunktio on

 

Tästä seuraa, että jakauman ala- ja ylä­kvartiilit ovat x0-γ ja x0+γ),

ja kvartiilien erotus näin ollen 2γ.

Cauchy-jakauman kvantiili­funktion derivaatta eli jakauman kvantiili­tiheys­funktio on:

 

Jakauman differentiaalinen entropia määritellään sen kvantiili­tiheys­funktion avulla:[6], nimittäin

 

Ominaisuuksia

muokkaa
 
Cauchy-jakauman (eli Lorentz-jakauman) ja Gaussin normaalijakauman tiheysfunktioiden vertailu, josta ilmenevät edellisen paksummat "hännät".

Cauchy-jakauma on esimerkki jakaumasta, jolla ei ole odotusarvoa, varianssia eikä korkeampia momentteja. Sen sijaan sillä kyllä on hyvin määritelty moodi eli tiheys­funktion maksimi­kohta ja mediaani, jotka molemmat ovat suuruudeltaan x0. Jakauman tiheys­funktion kuvaaja on lisäksi symmetrinen tämän mediaanin suhteen ja muistuttaa muodoltaan normaalijakauman kuvaajaa eli Gaussin käyrää, mutta ei silti toteuta odotus­arvon määritelmän ehtoja. Cauchy-jakauman tiheysfunktio lähestyy kummassakin päässä nollaa oleellisesti hitaammin kuin normaalijakauman; sanotaan, että sillä on paksummat "hännät".

Jos X1, ..., Xn ovat riippumattomia ja identtisesti jakautuneita satunnais­muuttujia, joista jokainen noudattaa standardia Cauchy-jakaumaa, niiden otos­keski­arvo (X1+ ... +Xn)/n noudattaa samaa standardia Cauchyn jakaumaa.[2] Tämä voidaan osoittaa laskemalla keskiarvon karakteristinen funktio:

 

missä   on otos­keski­arvo. Keskeinen raja-arvolause ei siis päde Cauchy-jakaumalle, mutta sillä ei olekaan lauseen edellyttämää äärellistä varianssia, ja näin ollen tämä esimerkki osoittaa, että tämä todella on oleellinen edellytys, jota ei voida jättää huomioon ottamatta. Myöskään suurten lukujen laki ei koske Cauchy-jakaumaa, koska sillä ei ole odotus­arvoa. Cauchy-jakauma on täysin vakaa jakauma.[7]

Standardi Cauchy-jakauma saadaan myös erikois­tapauksena Studentin t-jakaumasta, kun vapausasteita on yksi.[3]

Kuten kaikkien muidenkin vakaiden jakaumien tapauksessa, se lokaatio-skaala-perhe, johon Cauchy-jakauma kuuluu, on suljettu sellaisten lineaaristen muunnosten suhteen, joiden kertoimet ovat reaalilukuja. Lisäksi jakauma­perhe on suljettu reaali­kertoimisten lineaaristen frationaalisten muunnosten suhteen.[8]

Karakteristinen funktio

muokkaa

OlkoonX Cauchy-jakautunut satunnais­muuttuja. Jakauman karakteristinen funktio on[3]

 

mikä on samalla tiheysfunktion Fourier-muunnos. Alkuperäinen toden­näköisyy­stiheys voidaan esittää karakteristisen funktion avulla oleellisesti käyttämällä käänteistä Fourier-muunnosta:

 

On huomattava, että karakteristinen funktio ei ole differentioituva origossa: tämä vastaa sitä, että Cauchy-jakaumalla ei ole odotusarvoa.

Miksi odotusarvoa ja momentteja ei voida määrittää

muokkaa

Odotusarvo

muokkaa

Jos todennäköisyysjakaumalla on tiheysfunktio f(x), sen odotusarvo on

 

Kysymys on nyt siitä, miten määritellään integraali molemmista päistä rajoittamattoman välin yli: onko se sama kuin

 

jokaisella mieli­valtaisella reaali­luvulla a.

Jos ainakin toinen lausekkeen (2) yhteen­laskettavista on äärellinen, lausekkeet (1) ja (2) ovat yhtä suuret. Mutta Cauchy-jakauman tapauksessa edellinen näistä yhteen­laskettavista on miinus ääretön, jälkimmäinen plus ääretön, eikä niiden summaa voida laskea. Sen vuoksi lauseke (1) ei ole määritelty, eikä Cauchyn jakaumalla sen vuoksi ole odotusarvoa.[9]

Vaikuttaisi ehkä luonnolliselta käsittää lauseke (1) raja-arvoksi

 .

Tämä raja-arvo, niin sanottu Cauchyn perusarvo, on nolla. Mutta lausekkeen (1) voitaisiin yhtä hyvin tulkita tarkoittavan myös esimerkiksi raja-arvoa

 

joka ei ole nolla, mikä voidaan todeta suorittamalla integrointi.

Monet odotus­arvoa koskevat toden­näköisyys­laskennan tulokset kuten vahva suurten lukujen laki eivät tällaisissa tapauksissa päde.[9]

Korkeammat momentit

muokkaa

Cauchy-jakaumalla ei ole minkään asteen äärellisiä momentteja. Jotkin korkeammista raaoista momenteista sillä kyllä on, ja ne ovat äärettömiä, esimerkiksi raaka toinen momentti:

 

Järjestämällä lauseke uudestaan huomataan, että toinen momentti on oleellisesti vakion, tässä luvun 1, integraali äärettömän välin yli. Myös korkeammat parillisen potenssin raa'at momentit saavat arvon ääretön. Parittoman potenssin raakoja momentteja taas ei voida lainkaan määritellä. Ne nimittäin olisivat oleellisesti sama asia kuin lauseke  , sillä lausekkeessa olevat kaksi integraalia, joista toinen vähennetään toisesta, ovat molemmat äärettömiä. Ensimmäinen raaka momentti on sama kuin jakauman odotusarvo, jota tässä tapauksessa ei siis myöskään voida määritellä. Tämä taas merkitsee, että jakaumalle ei voida määritellä myöskään keskeisiä momentteja eikä standardoituja momentteja, sillä ne kaikki määritellään odotusarvon avulla. Samasta syystä Cauchy-jakaumalla ei ole myöskään varianssia, sillä se on sama kuin toinen keskeinen momentti, vaikka sillä onkin toinen raaka momentti, joka on ääretön.

Korkeampia momentteja koskevat tulokset seuraavat Hölderin epäyhtälötä, jonka mukaan alempien momenttien hajaantuessa korkeammatkin momentit hajaantuvat.

Parametrien estimointi

muokkaa

Koska Cauchyn jakauman parametrit eivät vastaa odotusarvoa ja varianssia, Cauchy-jakauman parametreja ei voida estimoida otoksen keskiarvon ja varianssin avulla.[10] Jos esimerkiksi otetaan Cauchy-jakauman mukaisesta aineistosta n otosta, tämän otoksen keskiarvo voidaan laskea:

 

Vaikka otoksen arvot xi keskittyvät lähelle mediaania x0, otoksen keskiarvo voi vaihdella yhä enemmän sitä mukaa kuin lisää otoksia poimitaan, koska on yhä todennäköisempää, että kohdataan tapauksia, jotka poikkeavat siitä paljon. Itse asiassa otosten keskiarvo noudattaa samaa jakaumaa kuin otokset itsekin, toisin sanoen suuren otoksen keskiarvo ei ole lainkaan parempi, joskaan ei huonompikaan arvio mediaanille x0 kuin mikään yksittäinen otokseen kuuluva havaintokaan. Samoin myös otoksen varianssi kasvaa yhä suuremmaksi, kun lisää otoksia poimitaan.

Siksi mediaanin x0 ja skaalaparametrin γ arvioimiseksi tarvitaan vahvempia menetelmiä. Muuan yksinkertainen keino on käyttää otoksen mediaania x0:n estimaattorina sekä ala- ja yläkrvartiilin erotusta estimaattorina γ:lle. Muitakin, tarkempia ja vahvempia menetelmiä on keksitty.[11][12] Esimerkiksi katkaistu keskiarvo otoksen järjestystilaston keskimmäisistä 24 prosentista tapauksia antaa x0:lle arvion tehokkaammin kuin koko otoksen mediaani.[13][14] Kun Cauchy-jakauma kuitenkin on ääripäistään "paksu" eli sen tiheysfunktio lähestyy kummassakin päässä vain hitaasti nollaa, arvion tehokkuus alenee, kun otoskoko ylittää 24 %.[13][14]

Parametrin x0 and γ arviointiin voidaan käyttää myös suurimman uskottavuuden estimointia. Se on yleensä kuitenkin hankalaa, koska sitä varten on ratkaistava korkeamman asteen polynomiyhtälö, ja sillä voi olla useita ratkaisuja, jotka vastaavat korkeamman asteen polynomiyhtälön juuret, ja sillä voi olla useita juuria, jotka vastaavat lokaaleja maksimikohtia.[15] Lisäksi vaikka suurimman uskottavuuden estimointi onkin asymptoottisesti tehokas, pienillä otoksilla se on melko tehoton.[16][17] Otoskoolla n Cauchy-jakauman logaritminen todennäköisyysfunktio on:

 

Maksimoimalla logaritminen todennäköisyysfunktio x0:n ja γ:n suhteen saadaan seuraava yhtälöryhmä:

 
 

On huomattava, että

 

on γ:n monotoninen funktio ja että ratkaisun γ täytyy toteuttaa epäyhtälö

 

Pelkän x0:n ratkaiseminen edellyttää 2n-1:nnen asteen polynomiyhtälön ratkaisemista,[15] ja pelkän γn ratkaiseminen n:nnen asteen polynomiyhtälön ratkaisemista (ensin γ2:n, sitten x0:n). Siksi yleensä onkin käytettävä tietokoneella suoritettavia numeerisen analyysin menetelmiä, olipa tarkoituksena ratkaista molemmat parametrit tai vain toinen niistä. Suurimman uskottavuuden estimoinnin etuna on asymptoottinen tehokkuus; x0:n estimointi otoksen mediaanin avulla on vain 81-prosenttisesti niin tehokas kuin sen estimointi suurimman uskottavuuden menetelmällä.[14][18] Katkaistun otoskeskiarvon menetelmä 24 prosentin järjestystilastolla on asymptoottisesti noin 88-prosenttisesti niin tehokas kuin x0:n estimointi suurimman uskottavuuden menetelmällä.[14] Menetelmiä voidaan myös yhdistää etsimällä keskimmäisten 24 prosentin järjestystilastolla x0 jokin alustava likiarvo, jota sitten parannetaan suurimman uskottavuuden estimaattoreilla soveltamalla Newtonin menetelmää.


Moniulotteinen Cauchy-jakauma

muokkaa

Satunnaisvektorin X = (X1, ..., Xk)' sanotaan noudattavan moniulotteista Cauchy-jakaumaa, jos sen komponenttien jokainen lineaarikombinaatio Y = a1X1 + ... + akXk noudattaa Cauchy-jakaumaa. Toisin sanoen jokaisen vakiovektorin   ja satunnaisvektorin X pistetulo a · X noudattaa tavallista (yksiulotteista) Cauchy-jakaumaa.[19] Moniulotteisen Cauchy-jakauman karakteristinen funktio on

 

missä x0(t) ja γ(t) ovat reaalifunktioita, joilla x0(t) on ensimmäisen asteen homogeeninen funktio ja γ(t) positiivinen homogeeninen ensimmäisen asteen funktio.[19] Täsmällisemmin sanottuna:[19]

 
 

kaikilla t.

Esimerkki bivariaattisesta Cauchy-jakaumasta saadaan lausekkeella:[20]

 

Vaikka tämä esimerkki ei olekaan analoginen kovariantin matriisin kanssa, voidaan todeta, että x ja y eivät ole riippumattomia.[20]

Analogisesti tavallisen yksiulotteisen tiheysfunktion kanssa myös moniulotteinen Cauchyn tiheysfunktio liittyy läheisesti moniulotteiseen Studentin jakaumaan. Jos viimeksi mainitun vapausasteluku on 1, kyseessä on sama kuin moniulotteisen Cauchy-jakauma. Ja k-ulotteisen Studentin jakauman tiheysfunktio yhdellä vapausasteella on:

 

Muunnosominaisuudet

muokkaa
  • Jos  , niin  
  • Jos   ja   ovat riippumattomia, niin  
  • Jos  , niin  
  • McCullaghin parametraatio Cauchy-jakaumalle: Jos Cauchy-jakauman ilmaiseminen kompleksiparametrin  , voidaan märitellä, että X ~ Cauchy(ψ), jos X ~ Cauchy . Jos X ~ Cauchy(ψ) niin:
  ~ Cauchy 

missä a,b,c ja d ovat reaalilukuja.

  • Jos X ~ Cauchy(ψ) edellä esitetyn määritelmän mukaisessa mielessä, niin
  ~ CCauchy 
missä "CCauchy" on sirkulaarinen Cauchy-jakauma.

Suhde muihin jakaumiin

muokkaa
  •   on sama kuin   Studentin t-jakauma
  •   on sama kuin  , ei-standardoitu Studentin t-jakauma
  • Jos   ja X ja Y ovat riippumattomia, niin  
  • Jos   niin  
  • Jos X ~ Log-Cauchy(0, 1) niin ln(X) ~ Cauchy(0, 1)
  • Cauchy-jakauma on rajatapaus tyypin 4 Pearsonin jakaumastalähde?
  • Cauchy-jakauma on erikoistapaus tyypin 7 Pearsonin jakaumasta[21]
  • Cauchy-jakauma on hyperbolisen jakauman singulaarinen raja-arvo
 
Käännös suomeksi
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Cauchy distribution

Lähteet

muokkaa
  1. a b Earliest Known Uses of Some of the Words in Mathematics (C): Cauchy distribution jeff560.tripod.com. Viitattu 13.1.2016.
  2. a b c Pekka Tuominen, Pekka Norlamo: ”Cauchy-jakaumat”, Todennäköisyyslaskenta, osa 2, s. 429–432. Limes ry, 1978. ISBN 951-745-023-0.
  3. a b c Pekka Tuominen, Pekka Norlamo: ”Jakaumat pähkinänkuoressa”, Todennäköisyyslaskenta, osa 2, s. 622. Limes ry, 1978. ISBN 951-745-023-0.
  4. S. M. Stigler: ”Luku 18: Cauchy and the Witch of Agnesi”, Statistics on the Table. Harvard.
  5. Cauchy distribution Wolfram MathWorld. Eric W. Weisstein.
  6. Oldrich Vasicek: A Test for Normality Based on Sample Entropy. Journal of the Royal Statistical Society, Series B, 1976, 38. vsk, nro 1, s. 54–59.
  7. Campbell B. Read, N. Balakrishnan, Brani Vidakovic, Samuel Kotz: Encyclopedia of Statisical Sciences, 2. painos, s. 778. John Wiley & Sons, 2006. ISBN 978-0-471-15044-2.
  8. F. B. Knight: A characterization of the Cauchy type. Proceedings of the American Mathematical Society, 1976, 55. vsk, s. 130–135. doi:10.2307/2041858. JSTOR:2041858.
  9. a b Cauchy Distribution University of Alabama, Huntsville, Virtual Laboratories. Viitattu 13.1.2016.
  10. Illustration of instability of sample means statistics4u.info.
  11. Gwenda J. Cane: Journal of the American Statistical Association, 1974, 69. vsk, nro 345, s. 243–245. doi:10.1080/01621459.1974.10480163. JSTOR:2285535.
  12. Jin Zhang: A Highly Efficient L-estimator for the Location Parameter of the Cauchy Distribution. Computational Statistics, 2010, 25. vsk, nro 1, s. 97–105. doi:10.1007/s00180-009-0163-y. Artikkelin verkkoversio.[vanhentunut linkki]
  13. a b Thomas J. Rothenberg, Franklin M. Fisher, C. B. Tilanus: A note on the estimation from a Cauchy sample. Journal of the American Statistical Association, 1966, 59. vsk, nro 366, s. 460–463. doi:10.1080/01621459.1964.10482170.
  14. a b c d Daniel Bloch: A note on the estimation of the location parameters of the Cauchy distribution. Journal of the American Statistical Association, 1966, 61. vsk, nro 316, s. 852–855. doi:10.1080/01621459.1966.10480912. JSTOR:2282794.
  15. a b Thomas S. Ferguson: Maximum Likelihood Estimates of the Parameters of the Cauchy Distribution for Samples of Size 3 and 4. Journal of the American Statistical Association, 1978, 73. vsk, nro 73. doi:10.1080/01621459.1978.10480031. JSTOR:2286549.
  16. Gabriella V. Cohen Freue: The Pitman estimator of the Cauchy location parameter. Journal of Statistical Planning and Inference, 2007, 137. vsk, nro 6. doi:10.1016/j.jspi.2006.05.002. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
  17. Rand Wilcox: Introduction to Robust Estimation & Hypothesis Testing. Elsevier, 2012.
  18. V. D. Barnett: Order Statistics Estimators of the Location of the Cauchy Distribution. Journal of the American Statistical Association, 1966, 61. vsk, nro 316. doi:10.1080/01621459.1966.10482205. JSTOR:2283210.
  19. a b c Thomas S. Ferguson: A Representation of the Symmetric Bivariate Cauchy Distribution. The Annals of Mathematical Statistics, 1962. doi:10.1214/aoms/1177704357. JSTOR:2237894.
  20. a b Geert Molenberghs, Emmanuel Lesaffre: Non-linear Integral Equations to Approximate Bivariate Densities with Given Marginals and Dependence Function. Statistica Sinica, 1997, 7. vsk, s. 713–738. Artikkelin verkkoversio.
  21. N. L. Johnson, S. Kotz, N. Balakrishnan: ”Chapter 16”, Continuous Univariate Distributions, Volume 1. New York: Wiley, 1994.

Aiheesta muualla

muokkaa