Log-normaalijakauma
Log-normaalijakauma[1] eli logaritminormaalijakauma[2] on todennäköisyyslaskennassa sellaisen jatkuvan satunnaismuuttujan jakauma, jonka logaritmi on normaalisti jakautunut. Toisin sanoen, jos satunnaismuuttuja on log-normaalisti jakautunut, niin on normaalisti jakautunut, ja jos on normaalisti jakautunut, niin on log-normaalisti jakautunut.[2] Log-normaalisti jakautunut satunnaismuuttuja voi saada vain positiivisia reaalilukuarvoja. Jakauma on käyttökelpoinen malli monille fysikaalisille, teknisille, taloustieteellisille ja muilla aloilla esiintyville muuttujille.
Tiheysfunktio | |
Kertymäfunktio | |
Merkintä | |
---|---|
Parametrit | μ ∈ R σ2 > 0 |
Määrittelyjoukko | x ∈ R |
Tiheysfunktio | |
Kertymäfunktio | |
Odotusarvo | |
Mediaani | |
Moodi | |
Varianssi | |
Vinous | |
Huipukkuus | |
Entropia | |
Momentit generoiva funktio | määritelty vain luvuille, joilla on ei-positiivinen reaaliosa |
Karakteristinen funktio | esitys hajaantuu asymptoottisesti, mutta sopii numeeristen likiarvojen laskentaan |
Fisherin informaatiomatriisi |
Jakaumaa nimitetään toisinaan myös Galtonin jakaumaksi Francis Galtonin mukaan.[3] Muita siihen toisinaan yhdistettyjä nimiä ovat McAlister, Gibrat ja Cobb-Douglas.[3]
Todennäköisyyslaskennan keskeisen raja-arvolauseen mukaan monen riippumattoman satunnaismuuttujan summa noudattaa sitä tarkemmin normaalijakaumaa, mitä enemmän näitä satunnaismuuttujia on. Samaan tapaan tarpeeksi monen toisistaan riippumattoman satunnaismuuttujan tulolla on taipumus noudattaa log-normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on.[4] Log-normaalijakaumalla on myös suurin entropia niistä jakaumista, joilla on tietty odotusarvo ja varianssi.[5]
Määritelmä
muokkaaJakauman muodostaminen ja parametrit
muokkaaOlkoon standardinormaalijakaumaa noudattava satunnaismuuttuja, ja olkoot ja kaksi reaalilukua. Silloin satunnaismuuttujan
jakaumaa sanotaan log-normaalijakaumaksi parametrein and . Nämä parametrit ovat tällöin jakauman luonnollisen logaritmin odotusarvo ja keskihajonta, mutta eivät itse jakauman odotusarvo ja varianssi.
Tämä yhteys pätee logaritmi- tai eksponenttifunktion kantaluvusta riippumatta. Jos on normaalisti jakautunut, samoin on myös , olivatpa ja mitkä tahansa positiiviset luvut ( . Samoin jos on log-normaalisti jakautunut, samoin on satunnaismuuttujan laita, kun .
Sellaisen jakauman muodostamiseksi, jolla on haluttu odotusarvo ja varianssi , on valittava ja
Vaihtoehtoisesti voidaan käyttää "multiplikatiivisia" eli "geometrisia" parametreja ja . Niillä on suorempi tulkinta: on jakauman mediaani, ja liittyy jakauman leviämiseen jäljempänä selitettävällä tavalla.
Tiheysfunktio
muokkaaPositiivinen satunnaismuuttuja X on log-normaalisti jakautunut, jos X:n logaritmi on normaalisti jakautunut, jolloin
Olkoon normaalijakauman N(0,1) kertymäfunktio ja sen tiheysfunktio. Tällöin saadaan:[2]
- ,
missä esimerkiksi tarkoittaa todennäköisyyttä sille, että satunnaismuuttujan X arvo on pienempi kuin x.
Kertymäfunktio
muokkaaLog-normaalijakauman kertymäfunktio on
missä on normeeratun normaalijakauman N(0,1) kertymäfunktio.
Virhefunktion avulla kertymäfunktio voidaan esittää muodossa:[4]
missä erfc on komplementaarinen virhefunktio erfc(x) = 1 - erf(x).
Useamman muuttujan lognormaalijakauma
muokkaaJos on useamman muuttujan normaalijakauma, niin funktio noudattaa useamman muuttujan logaritmista normaalijakaumaa.[6][7], jonka odotusarvo on
Useamman muuttujan logaritminormaalijakauma ei kuitenkaan ole kovin yleisessä käytössä, minkä vuoksi jäljempänä rajoitutaan käsittelemään yhden muuttujan jakaumaa.
Karakteristinen funktio ja momentit generoiva funktio
muokkaaLogaritmisella normaalijakaumalla on kaikki momentit, ja
Tämä voidaan johtaa sijoittamalla integraaliin . Kuitenkaan odotusarvo ei ole määritelty millään argumentin positiivisella arvolla, koska sen määrittelevä integraali hajaantuu. Sen vuoksi logaritmisella normaalijakaumalla ei myöskään ole momentit generoivaa funktiota.[8] Tähän liittyy se, että logaritmisen normaalijakauman momentit eivät yksikäsitteisesti määrittele jakaumaa.
Karakteristinen funktio on määritelty reaaliarvoille , mutta ei sellaisille kompleksiluvuille, joilla on negatiivinen imaginaariosa, minkä vuoksi karakteristinen funktio ei ole analyyttinen origossa. Tämän vuoksi logaritmisen normaalijakauman karakteristista funktiota ei voida esittää päättymättömänä suppenevana sarjana.[9] Erityisesti sen muodollinen Taylorin sarja
hajaantuu. Funktiolle on kuitenkin voitu muodostaa vaihtoehtoisia hajaantuvia sarjaesityksiä.[9][10][11][12]
Karakteristiselle funktiolle ei tunneta suljetussa muodossa esitettävää lauseketta. Sille saadaan kuitenkin hyviä likiarvoja lausekkeesta[13]
missä on Lambertin W-funktio. Tämä likiarvo voidaan johtaa asymptoottisella menetelmällä, mutta se pätee likimäärin kaikilla :n arvoilla, joilla suppenee.
Ominaisuuksia
muokkaaGeometriset eli multiplikatiiviset momentit
muokkaaLogaritmisen normaalijakauman geometrinen eli multiplikatiivinen keskiarvo on . Se on samalla jakauman mediaani. Jakauman geometrinen eli multiplikatiivinen keskihajonta on .[14][15] Analogisesti aritmeettisten tilastollisten tunnuslukujen kanssa voidaan määritellä geometrinen varianssi , ja myös geometrista variaatiokerrointa[14] on ehdotettu. Viimeksi mainitun olisi tarkoitus olla analoginen tavallisen variaatiokertoimen kanssa lognormaalin aineiston tapauksessa, mutta tällä määritelmällä ei ole sellaista teoreettista perustaa, että sen perusteella voitaisiin arvioida itse variaatiokerrointa .
On huomattava, että geometrinen keskiarvo on aina pienempi kuin sen aritmeettinen keskiarvo. Tätä tosiasiaa sanotaan aritmeettis-geometriseksi epäyhtälöksi, ja se kuvastaa sitä tosiasiaa, että logaritmifunktion kuvaaja on ylöspäin kupera. Itse asiassa pätee yhteys
Liikealalla termiä tulkitaan toisinaan kuperuuskorjaukseksi. Stokastisen analyysin kannalta kyseessä on sama korjaustermi kuin geometrista Brownin liikettä koskevassa Itôn lemmassa.
Aritmeettiset momentit
muokkaaKun on mikä tahansa reaali- tai kompleksiluku, lognormaalisti jakautuneen satunnaismuuttujan n:s momentti on[3]
Erityisesti lognormaalisti jakautuneen satunnaismuuttujan aritmeettinen keskiarvo, odotusarvo, aritmeettinen varianssi ja aritmeettinen keskihajonta ovat:
- .
Jakauman aritmeettinen variaatiokerroin määritellään sen keskihajonnan ja keskiarvon suhteena:
- .
Logaritmisen normaalijakauman tapauksessa se on:
Tätä tulosta sanotaan joskus "geometriseksi variaatiokertoimeksi" (engl. Geometric coefficient of variation, GCV)[17][18]. Aritmeettisesta keskihajonnasta poiketen se on aritmeettisesta keskiarvosta riippumaton.
Parametrien ja arvot voidaan laskea, jos aritmeettinen keskiarvo ja varianssi tunnetaan:
Momentit eivät määritä todennäköisyysjakaumaa yksikäsitteisesti. Toisin sanoen on muitakin jakaumia, joilla on samat momentit. Itse asiassa on koko joukko jakaumia, joilla on samat momentit kuin logaritmisella normaalijakaumalla.
Moodi, mediaani ja kvantiilit
muokkaaJakauman moodi on piste, jossa sen tiheysfunktio saa suurimman arvonsa. Erityisesti se toteuttaa yhtälön , josta saadaan:
Koska logaritmisesti muunnettu muuttuja on normaalisti jakautunut ja koska kvantiilit säilyvät monotonisissa muutoksissa, muuttujan kvantiilit ovat:
missä on standardin normaalijakauman kvantiili.
Erityisesti logaritmisen normaalijakauman mediaani on sama kuin sen geometrinen keskiarvo.[19]
Osittainen odotusarvo
muokkaaSatunnaismuuttujan osittainen odotusarvo kynnysarvon suhteen määritellään seuraavasti:
Vaihtoehtoisesti se voidaan kirjoittaa ehdollisen odotusarvon avulla muotoon . Logaritmisen normaalijakauman tapauksessa osittainen odotusarvo on:
missä on normaalijakauman kertymäfunktio. Osittaisen odotusarvon kaavalla on käyttöä vakuutusalalla ja taloustieteessä, ja sen avulla ratkaistaan Black–Scholesin kaavaan johtava osittaisdifferentiaaliyhtälö.
Ehdollinen odotusarvo
muokkaaLog-normaalin satunnaismuuttujan ehdollinen odotusarvo kynnysarvon suhteen on sen osittainen odotusarvo jaettuna sen kumulatiivisella todennäköisyydellä olla tällä välillä:
Vaihtoehtoisia parametrointeja
muokkaaLog-normaalijakauma määritetään tavallisimmin parametrien tai avulla, mutta vaihtoehtoisesti se voidaan parametroida useilla muillakin tavoilla. Todennäköisyysjakaumien tietokanta ProbOnto tuntee kaikkiaan seitsemän muuta tapaa parametroida log-normaalijakauma:[20][21]
- Normal1(μ,σ), parametreina odotusarvo μ ja keskihajonta σ[22]
- LogNormal2(μ,υ), parametreina odotusarvo μ ja varianssi υ, molemmat logaritmisella asteikolla
- LogNormal3(m,σ), parametreina mediaani m lineaarisella asteikolla ja keskihajonta σ logaritmisella asteikolla
- LogNormal4(m,cv), parametreina mediaani m ja variaatiokerroin cv, molemmat lineaarisella asteikolla
- LogNormal5(μ,τ), parametreina odotusarvo μ ja tarkkuus τ, molemmat logaritmisella asteikolla.[23]
- LogNormal6(m,σg), parametreina mediaani m ja geometrinen keskihajonta σg, molemmat lineaarisella asteikolla[24]
- LogNormal7(μN,σN), parametreina odotusarvo μN ja keskihajonta σN, molemmat lineaarisella asteikolla[25]
Esimerkkejä uudelleenparametroinneista
muokkaaTarkastellaan tilannetta, jossa samaa aineistoa halutaan mallintaa kahdella tavalla käyttämällä kahta erilaista optimointivälinettä, esimerkiksi PFIM[26] and PopED.[27] Näistä edellinen tukee LN2-, jälkimminen LN7-parametrointia. Siksi tarvitaan uudelleenparametrointia, sillä muutoin mallit johtaisivat eri tuloksiin.
Muunnokselle pätevät kaavat: .
Muunnokselle taas pätevät kaavat: .
Muut uudelleenparametrointikaavat löytyvät ProbOnto -tietokannasta.[20]
Monikerta, käänteisarvo ja potenssit
muokkaa- Vakiolla kertominen: Jos , niin .
- Käänteisarvo: If , niin .
- Potenssi: If , niin , kun .
Log-normaalisti jakautuneiden satunnaismuuttujien kerto- ja jakolasku
muokkaaJos kaksi riippumatonta log-normaalisti jakautunutta satunnaismuuttujaa, ja , kerrotaan keskenään, niiden tulo on sekin log-normaalisti jakautunut, parametreina ja , missä . Tämän avulla voidaan helposti muodostaa useammankin log-normaalin satunnaismuuttujan tulon jakauma: Jos ovat riippumatonta, log-normaalisti jakautunutta satunnaismuuttujaa, niin
Jos taas log-normaalisti jakautunut satunnaismuuttuja , jonka parametrit ovat ja , jaetaan toisella siitä riippumattomalla log-normaalisti jakautuneella satunnaismuuttujalla , jonka parametrit ovat ja , näiden osamäärä on sekin log-normaalisti jakautunut, parametreina ja .
Multiplikatiivinen keskeinen raja-arvolause
muokkaaSamalla tavalla jakautuneiden riippumattomien positiivisten satunnaismuuttujien multiplikatiivinen eli geometrinen keskiarvo noudattaa logaritmista normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on. Tätä tulosta sanotaan multiplikatiiviseksi keskeiseksi raja-arvolauseeksi, ja se seuraa suoraan todennäköisyyslaskennan keskeisestä raja-arvolauseesta, kun sitä sovelletaan muuttujiin, jotka saadaan alkuperästen satunnaismuuttujien logaritmeina.
Muuta
muokkaaLog-normaalijakaumaa noudattavalla aineistolla on symmetrinen Lorenzin käyrä.[28]
Jakauman harmoninen ( ), geometrinen ( ) ja aritmeettinen keskiarvo ( ) liittyvät toisiinsa seuraavasti:[29]
Log-normaalit jakaumat ovat äärettömästi jaollisia,[30], mutta eivät stabiileja jakaumia.[31]
Yhteydet muihin jakaumiin
muokkaa- Jos on normaalisti jakautunut, niin
- Jos on jakautunut log-normaalisti, niin on jakautunut normaalisti.
- Olkoot riippumattomia log-normaaleja jakaumia, joilla mahdollisesti on erisuuret parametrit ja , ja okoon . Tällöin :n jakaumaa ei voida esittää suljetussa muodossa, mutta sitä voidaan sen oikeassa päässä approksimoida toisella log-normaalilla jakaumalla .[32] Sen tiheysfunktion muoto tunnetaan myös 0:n läheisyydessä[31] missä se ei muistuta mitään log-normaalia jakaumaa. Sille saadaan L. F. Fentonin tunnetuksi tekemä, mutta R.I. Wilkinsonin jo aikaisemmin esittämä ja Marlowin matemaattisesti perustelema likiarvo[33]) käyttämällä toisen log-normaalin jakauman keskiarvoa ja varianssia:
- Jos kaikilla muuttujilla on sama varianssiparametrin arvo , nämä kaavat yksinkertaistuvat muotoon
Vielä parempia likiarvoja voidaan saada arvioimalla jakauman tiheys- ja kertymäfunktiota Monte Carlo menetelmällä.[34][35]
- Jos , niin muuttujan jakaumaa sanotaan kolmiparametriseksi log-normaaliksi, ja se on jakautunut välille .[36] , .
- Log-normaalijakauma on erikoistapaus puolittain rajoitetusta Johnsonin jakaumasta.
- Jos with , niin (Suzukin jakauma).
- Lognormaalijakaumalle saadaan likiarvo, jonka integraali voidaan esittää alkeisfunktioiden avulla[37], käyttämällä sen määritelmässä normaalijakauman sijasta logistista jakaumaa. Tällöin jakauman kertymäfunktioksi saadaan:
- Tämä on log-logistinen jakauma.
Tilastollisia päätelmiä
muokkaaParametrien estimointi
muokkaaLognormaalijakauman parametrien μ ja σ suurimman uskottavuuden estimaattorien määrittämiseksi voidaan käyttää samaa menetelmää, jolla ne määritellään normaalijakaumalle. Voidaan todeta, että
- ,
missä on normaalijakauman tiheysfunktio. Niinpä log-normaalijakauman uskottavuusfunktio on
- .
Koska tässä ensimmäinen termi on vakio μ:n ja σ: suhteen, molemmat logaritmiset uskottavuusfunktiot, ja , saavat maksiminsa samoilla :n ja :n arvoilla. Niinpä suurimman uskottavuuden estimaattorit ovat samat kuin normaalijakaumalle havaintoarvoilla ,
Äärellisillä n:n arvoilla näillä estimaattoreilla esiintyy systemaattinen virhe. Tämä virhe on tosin :n osalta häviävän pieni, mutta :lle saadaan vähemmän vääristynyt arvo korvaamalla :n yhtälössä nimittäjä n arvolla n-1.
Jos yksittäisiä arvoja ei tunneta mutta aineiston keskiarvo ja keskihajonta s tunnetaan, vastaavat parametrit saadaan seuraavista kaavoista, jotka on muodostettu ratkaisemalla ja odotusarvon ja varianssin yhtälöistä:
- .
Tilastollisia tunnuslukuja
muokkaaLog-normaalisti jakautunutta aineistoa voidaan tehokkaimmin analysoida soveltamalla logaritmisesti muunnettuun aineistoon normaalijakaumaan perustuvia tunnettuja metodeja ja suorittaa sen jälkeen tuloksille käänteinen muunnos.
Hajontavälit
muokkaaTyypillisen esimerkin tästä muodostavat hajontavälit. Normaalisti jakautunut satunnaismuuttuja on noin kahden kolmasosan (68 %) todennäköisyydellä välillä ja noin 95 %:n todennäköisyydellä välillä . Sen vuoksi log-normaalisti jakautunut satunnaismuuttuja on
- välillä todennäköisyydellä 2/3 ja
- välillä todennäköisyydellä 95 %
Käyttämällä estimoituja parametreja suunnilleen samat prosenttiosuudet log-normaalisti jakautuneesta aineistosta on näillä väleillä.
:n luottamusväli
muokkaaSamalla periaatteella todetaan, että :n luottamusväli on , missä on standardipoikkeama ja q Studentin t-jakauman 97,5 prosentin kvantiili, vapausasteluvulla n-1. Käänteisellä muunnoksella saadaan :n luottamusväliksi
- with
Entropian ääriarvoperiaate vapaan parametrin määrittämiseksi
muokkaa- Sovelluksissa on määritettävä parametri. Kasvuproseseissa, joissa tuotto ja häviö tasapainottavat, saadaan Shannonin ääriarvoperiaatetta soveltamalla:
- Tämän arvon avulla voidaan muodostaa skaalausrelaatio lognormaalijakauman maksimikohdan ja käännepisteiden välille.[38] Osoittautuu, että tämän yhteyden määrittää Neperin luku, ja sillä on tiettyjä geometrisia yhtäläisyyksiä minimipintaenergiaperiaatteen kanssa.
- Nämä skaalausrelaatiot ovat osoittautuneet käyttökelpoisiksi useiden kasvuprosessien ennustamisessa. Sellaisia ovat esimerkiksi epidemioiden leviäminen, kiinteälle pinnalle muodostuvien nestepisaroiden laajeneminen, väestön kasvu, pyörteen syntyminen pesuallasta tyhjennettäessä, kielen piirteiden levinneisyys, turbulenssin nopeusprofiili ja monet muut.
- Arvon avulla saadaan probabilistinen ratkaisu Draken epäyhtälölle.[39]
Esiintyminen ja sovelluksia
muokkaaLog-normaalijakaumaa voidaan soveltaa moniin luonnonilmiöihin. Tyypillisessä tapauksessa sen käyttö voidaan perustella seuraavasti: Monet luonnon kasvuilmiöt muodostuvat suuresta määrästä pieniä muutoksia, joissa kohteen koko kasvaa pienen prosenttimäärän verran entisestään. Tällaiset muutokset kumuloituvat multiplikatiivisesti, mutta logaritmisella asteikolla additiivisesti. Jos jokaisen yksittäisen muutoksen vaikutus on mitättömän pieni, keskeinen raja-arvolauseen mukaan niiden summan jakauma on lähempänä normaalijakaumaa kuin yksittäisten muutoksen jakauma. Tästä seuraa, että kasvavien kohteiden koon logaritmilla on taipumus noudattaa normaalijakaumaa, jolloin koko itse noudattaa log-normaalijakaumaa. Tosin jos jakauman keskihajonta on tarpeeksi pieni, normaalijakaumaa voidaan käyttää sillekin hyvänä likiarvona.
Tämä keskeisen raja-arvolauseen multiplikatiivinen versio tunnetaan myös Gibratin lakina, Robert Gibratin (1904–1980) mukaan, joka muotoili sen liikeyrityksille.[40] Jos näiden pienten muutosten kertymisnopeus ei vaihtele ajan kuluessa, kasvu tulee koosta riippumattomaksi. Vaikka näin ei tapahtuisikaan, minkä tahansa ajan kuluessa kasvavan suureen jakaumalla on taipumus muodostua logartminormaaliksi.
Toinen perustelu jakauman käytölle on, että perustavien luonnonlakien mukaan monien suureiden arvot saadaan kertomalla ja jakamalla positiivisia muuttujia. Esimerkkeinä voidaan mainita gravitaatiolaki, jonka mukaisesti voima määräytyy kappaleiden massojen ja niiden etäisyyden mukaan, tai kemikaalien konsentraatiot liuoksessa tasapainon vallitessa, jotka määräytyvät lähtöaineiden alkutilanteessa vallinneiden konsentraation mukaan. Tällaisia tilanteita voidaan mallintaa olettamalla, että muuttujat noudattavat logaritmista normaalijakaumaa.
Silloinkin kun edellä esitetyt perustelut eivät päde, logaritminen normaalijakauma on usein uskottava ja empiiristen havaintojen mukaan pätevä malli. Esimerkkeinä voidaan mainita:
- Ihmisten käyttäytymisestä:
- Internetin keskustelupalstoille lähetettyjen kommenttien pituuden on todettu noudattavan logaritmista normaalijakaumaa.[41]
- Aika, jonka käyttäjät pitävät verkosta lukemaansa artikkelia tai uutissivua auki, noudattaa myös logaritmista normaalijakaumaa.[42]
- Shakkipelierien kestolla on taipumus noudattaa logaritmista normaalijakaumaa.[43]
- Vääntöjen lukumäärä Rubikin kuutiota ratkaistaessa, sekä yleisesti että kullakin ratkaisijalla erikseen, näyttää noudattavan log-normaalia jakaumaa.[44]
- Biologian ja lääketieteen alalta:
- Elävien kudosten mitat kuten pituus, nahan pinta-ala ja paino.[45]
- Nopeasti leviävissä epidemioissa kuten SARS:issa vuonna 2003 sairaalassa hoidettujen tapausten lukumäärän on voitu todeta noudattavan log-normaalijakaumaa ilman vapaita parametreja, jos entropialla on tunnettu arvio ja keskihajonta voidaan määrittää entropian tuotannon maksimiperiaatteella.[46]
- Karvojen, kynsien ja hampaiden pituus niiden kasvusuunnassa noudattaa log-normaalijakaumaa.
- Normalisoitu RNA-sekvenssin pituutta millä tahansa genomialueella voidaan hyvin approksimoida log-normaalijakaumalla.
- Tietyt fysiologiset mittaustulokset kuten aikuisten ihmisten verenpaine noudattavat log-normaalijakaumaa, erikseen miehillä ja naisilla.[47]
- Neurotieteissä ärsykkeiden kulkua neuronien välillä approksimoidaan usein log-normaalijakaumalla. Tämä havaittiin ensin aivokuoressa ja aivojuoviossa[48], myöhemmin myös hippokampuksessa[49] ja muualla aivoissa.[50][51]
- Kolloidien ja polymeerien kemiassa:
- Hiukkasten koon jakaumat
- Moolimassojen jakaumat.
Tämän vuoksi terveiltä henkilöiltä tehtyjen mittausten viitearvot voidaan asianmukaisemmin määritellä olettamalla suureiden noudattavan logaritmista normaalijakaumaa kuin olettamalla niiden jakautuneen symmetrisesti keskiarvon molemmin puolin.
- Hydrologiassa logaritmista normaalijakaumaa käytetään mallinnettaessa esimerkiksi kuukauden tai vuoden suurinta yhdessä päivässä tullutta sademäärää tai jokien virtaamaa.[52]
- Oikealla oleva CumFreq:illä tehty kuva esittää esimerkkiä log-normaalijakauman sovittamisesta eri vuosien suurimpiin yhden päivän sademääriin, ja se osoittaa myös binomijakaumaan perustuvan 90%:n luottamusvälin.[53]
- Sadanta-aineistoa kuvaa kaavioon merkityt pisteet osana kumulatiivista frekvenssianalyysiä.
- Yhteiskuntatieteissä ja demografiassa:
- Todisteet viittaavat siihen, että väestön valtaosan (97%–99%) tulot ovat jakautuneet log-normaalisti.[54] (Sitä vastoin kaikkein suurituloisimpien tulot noudattavat Pareton jakaumaa.[55]
- Finanssialalla, varsinkin Black–Scholes-mallissa vaihtokurssien, hintaindeksien ja osakekurssi-indeksien muutosten logaritmien oletetaan olevan normaalisti jakautuneet.[56] Nämä muuttujat nimittäin käyttäytyvät kuin koronkorko, eivät yksinkertaisen koron tavoin, ja ovat näin ollen multiplikatiivisia. Kuitenkin jotkut matemaatikot kuten Benoit Mandelbrot ovat väittäneet[57], että logaritminen Lévyn jakauma raskaine "häntineen" olisi parempi malli varsinkin pörssiromahdusten analysointiin. Itse asiassa osakekurssien jakaumilla usein on paksu "häntä".[58] Tämä pörssiromahduksia kuvaava paksuhäntäinen jakauma ei toteuta keskeisen raja-arvolauseen edellytyksiä.
- Skientometriikassa on todettu, että tieteellisiin artikkeleihin tai patentteihin tehtyjen viittausten lukumäärä nopudattaa diskreettiä log-normaalia jakaumaa.[59][60]
- Kaupunkien asukaslukujen on väitetty noudattavan log-normaalijakaumaa.
- Teknologiassa
- Luotettavuusanalyysissä lognormaalijakaumaa käytetään usein mallina sille, kuinka monta kertaa ylläpidettävää systeemiä on korjattava.[61]
- Langattomassa tiedonsiirrossa paikallinen keskiteho ilmaistuna logaritmisella asteikolla kuten desibeleinä tai nepereinä noudattaa normaalijakaumaa.[62] Myös suurten rakennusten ja kukkuloiden radiosignaaleille aiheuttamaa varjostusta mallinnetaan usein log-normaalijakaumalla.
- Julkisesti saatavilla olevien video- ja äänitiedostojen koko noudattaa log-normaalijakaumaa viiden suuruusluokan välillä.[63]
- Tietokoneverkoissa ja Internet-tietoliikenteen analyysissä log-normaalijakauma on osoittautunut hyväksi tilastolliseksi malliksi liikenteen määrälle aikayksikköä kohti. Tämä on todettu soveltamalla tehokasta tilastollista lähestymistä suuriin ryhmiin todellisia Internet-jälkiä. Tässä yhteydessä log-normaalijakauman on todettu toimivan hyvin kahdessa tärkeässä käyttöyhteydessä: (1) ennakoitaessa sitä, kuinka suuren osan ajastaan liikenne ylittää tietyn rajan (palvelutasosopimuksissa tai linkin kapasiteetin arvioinnissa) sekä (2) ennustettaessa 95 %:n kvantiilihinnoittelua.[64]
Lähteet
muokkaa- ↑ Pentti Laininen: ”Tärkeitä jatkuvia jakaumismalleja”, Todennäköisyys ja sen tilastollinen soveltaminen, s. 96. Otatieto, 2001. ISBN 951-672312-8.
- ↑ a b c Pekka Tuominen, Pekka Norlamo: ”Satunnaismuuttujien yleistä teoriaa”, Todennäköisyyslaskenta, osa 2, s. 323. Limes ry, 1978. ISBN 951-745-023-0.
- ↑ a b c Norman L. Johnson, Samuel Kotz, N. Balakrishnan: ”Lognormal Distributions”, Continuous univariate distributions. Vol. 1. (2. painos) New York: John Wiley & Sons, 1994. ISBN 978-0-471-58495-7.
- ↑ a b Log Normal Distribution Wolfram MathWorld. Eric W. Weisstein. Viitattu 4.9.2020.
- ↑ Sung Y. Park, Anil K. Bera: Maximum entropy autoregressive conditional heteroskedasticity model. Journal of Econometrics, 2009, 150. vsk, nro 2, s. 219–230. doi:10.1016/j.jeconom.2008.12.014. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
- ↑ Ghasem Tarmast, Statistics Department, Faculty of Mathematical Science and Computer, Shahid Chamran University: Multivariate Log-Normal Distribution (PDF) isi.cbs.nl. 2001. Arkistoitu 19.7.2013. Viitattu 4.9.2020.
- ↑ Leigh J. Halliwell: The Lognormal Random Multivariate casact.org. 2015. Viitattu 4.9.2020.
- ↑ CC. Heyde: On a property of the lognormal distribution. Journal of the Royal Statistical Society, Series B, 1963, 25. vsk, nro 2, s. 392–393. ISBN 978-1-4419-5822-8. doi:10.1007/978-1-4419-5823-5_6.
- ↑ a b P. Holgate: The lognormal characteristic function. Communications in Statistics – Theory and Methods, 1989, 18. vsk, nro 12, s. 4539–4548. doi:10.1080/03610928908830173.
- ↑ R. Barakat: Sums of independent lognormally distributed random variables. Journal of the Optica Society of America, 1976, 66. vsk, nro 3, s. 211–216. doi:10.1364/JOSA.66.000211. Bibcode:1976JOSA...66..211B.
- ↑ E. Barouch, GM. Kaufman, ML. Glasser: On sums of lognormal random variables. Studies in Applied Mathematics, 1986, 75. vsk, nro 1, s. 37–55. doi:10.1002/sapm198675137. Artikkelin verkkoversio.
- ↑ Roy B. Leipnik: On Lognormal Random Variables: I – The Characteristic Function. Journal of the Australian Mathematical Society Series B, Tammikuu 1991, 32. vsk, nro 3, s. 327–347. doi:10.1017/S0334270000006901. Artikkelin verkkoversio.
- ↑ S. Asmussen, J.L. Jensen, L. Rojas-Nandayapa: On the Laplace transform of the Lognormal distribution. [ Methodology and Computing in Applied Probability, 2014, 18. vsk, nro 2, s. 441-458. Artikkelin verkkoversio.
- ↑ a b Thomas BL Kirkwood: Geometric means and measures of dispersion. Biometrics, 1979, 35. vsk, nro 4, s. 908–909. JSTOR:2530139.
- ↑ E. Limpert, W. Stahel, M. Abbt: Lognormal distributions across the sciences: keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
- ↑ Onset-Duration Matching of Acoustic Stimuli Revisited: Conventional Arithmetic vs. Proposed Geometric Measures of Accuracy and Precision. Frontiers in Psychology, 2017, nro 7. PubMed:28111557. PubMed Central:5216879. doi:10.3389/fpsyg.2016.02013.
- ↑ FAQ: Issues with Efficacy Analysis of Clinical Trial Data Using SAS PharmaSUG2011. Viitattu 4.9.2020.
- ↑ MH Schiff: Head-to-head, randomised, crossover study of oral versus subcutaneous methotrexate in patients with rheumatoid arthritis: drug-exposure limitations of oral methotrexate at doses >=15 mg may be overcome with subcutaneous administration. Ann Rheum Dis, 2014, 73. vsk, nro 8, s. 1–3. PubMed:24728329. PubMed Central:4112421. doi:10.1136/annrheumdis-2014-205228.
- ↑ Leslie E. Daly, Geoffrey Joseph Bourke: Interpretation and uses of medical statistics. (5th edition) Journal of Epidemiology and Community Health, 2000, 46. vsk, nro 3. Wiley-Blackwell. PubMed Central:1059583. doi:10.1002/9780470696750. ISBN 978-0-632-04763-5.
- ↑ a b ProbOnto probonto.org. Viitattu 4.9.2020.
- ↑ MH Swat, P. Grenon, S Wimalaratne: ProbOnto: ontology and knowledge base of probability distributions. Bioinformatis, 2016, 32. vsk, nro 17, s. 2719–2721. PubMed Central:5013898. doi:10.1093/bioinformatics/btw170.
- ↑ Forbes et al.: Probability Distributions. John Wiley & Sons Inc., 2011.
- ↑ D. Lunn: The BUGS book: a practial introduction to Bayesian analysis. Texts in statistical science, 2012. CRC Press.
- ↑ E. Limpert, W. Stahel. M. Abbt: Log-normal distributions across the sciences: Keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
- ↑ J. Nyberg: PopED - An extended, parallelized, population optimal design tool. Comput Methods Programs Biomed, 2012, 108. vsk, nro 2, s. 789–805. PubMed:22640817. doi:10.1016/j.cmpb.2012.05.005.
- ↑ S. Retout, S. Duffull, F. Mentré: Development and implementation of the population Fisher information matrix for the evaluation of population pharmacokinetic designs. Comp Meth Pro Biomed, 2001, 65. vsk, nro 2, s. 141–151. PubMed:11275334. doi:10.1016/S0169-2607(00)00117-6.
- ↑ PopED Manual, Release version 2.13. Technical report. PopED:n kehitystiimi, Uppsalan yliopisto, 2016.
- ↑ Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. Ecology, 2000, 81. vsk, nro 4, s. 1139–1142. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2.
- ↑ Lewis A. Rossman: Design stream flows based on harmonic means. Journal of Hydraulic Engineering, Heinäkuu 1990, 116. vsk, nro 7, s. 946–950. doi:10.1061/(ASCE)0733-9429(1990)116:7(946).
- ↑ Olof Thorin: On the infinite divisibility of the lognormal distribution. Scandinavian Actuarial Journal, 1977, nro 3, s. 121–148. doi:10.1080/03461238.1977.10405635. ISSN 0346-1238.
- ↑ a b Gao Xin: Asymptotic Behavior of Tail Density for Sum of Correlated Lognormal Variables. International Journal of Mathematics and Mathematical Sciences, 2009, s. 1–28. doi:10.1155/2009/630857.
- ↑ S Asmussen, L. Rojas-Nandayapa: Asymptotics of Sums of Lognormal Random Variables with Gaussian Copula. Statistics and Probability Letters, 2008, 78. vsk, nro 16, s. 2709–2714. doi:10.1016/j.spl.2008.03.035. Artikkelin verkkoversio.
- ↑ N. A. Marlow: A normal limit theorem for power sums of independent normal random variables. Bell System Technical Journal, Marraskuu 1967, 46. vsk, nro 9, s. 2081–2089. doi:10.1002/j.1538-7305.1967.tb04244.x.
- ↑ Z I Botev, P. L'Ecuyer: ”Accurate computation of the right tail of the sum of dependent log-normal variates”, 2017 Winter Simulation Conference (WSC), s. 1880–1890. (Las Vegasissa 3.-6.12.2017 pidetyn konferenssin julkaisu) IEEE, 2017. ISBN 978-1-5386-3428-8. doi:10.1109/WSC.2017.8247924. arXiv:1705.03196.
- ↑ Orthonormal polynomial expansions and lognormal sum densities Cornell University. Viitattu 4.9.2020.
- ↑ B. Sangal, A. Biswas: The 3-Parameter Lognormal Distribution Applications in Hydrology. Water Resources Research, 1970, 6. vsk, nro 2, s. 505–515. doi:10.1029/WR006i002p00505.
- ↑ P. K. Swanee: Near Lognormal Distribution. Journal of Hydrologic Engineering, 2002, 7. vsk, nro 6, s. 441–444. doi:10.1061/(ASCE)1084-0699(2002)7:6(441).
- ↑ a b Wu Ziniu, Li Juan, Bai Chenyuan: Scaling Relations of Lognormal Type Growth Process with an Extremal Principle of Entropy. Entropy, Määritä ajankohta! doi:10.3390/e19020056. Bibcode:2017Entrp..19...56W. Artikkelin verkkoversio.
- ↑ Frederck Bloetscher: Using predictive Bayesian Monte Carlo- Markov Chain methods to provide a probabilistic solution for the Drake equation. Acta Astronautica, 2019, nro 155, s. 118–130. doi:10.1016/j.actaastro.2018.11.033. Bibcode:2019AcAau.155..118B.
- ↑ John Sutton: Gibrat's Legacy. Journal of Economic Literature, Maaliskuu 1997, 32. vsk, nro 1, s. 40–59. JSTOR:2729692.
- ↑ Pawel Sobkowicz: Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law?. EPJ Data Science, 2013.
- ↑ Silence is also evidence: interpreting dwell time for recommendation from psychological perspective (konferenssijulkaisu, ACM International Conference on KDD) mldm.ict.ac.cn. 2013. Arkistoitu 10.5.2017. Viitattu 4.9.2020.
- ↑ What is the average length of a game of chess? chess.stackexchange.com. Viitattu 4.9.2020.
- ↑ Rubik's Cube Competitors' Mean times from 2019 competitions reddit.com. 21.8.2019. Viitattu 4.9.2020.
- ↑ Julian S. Huxley: Problems of relative growth. Lontoo, 1932. ISBN 978-0-486-61114-3.
- ↑ Jennifer S. K. Chan, Philip L. H. Yu: Modelling SARS data using threshold geometric process. Statistics in Medicine, 2006, 25. vsk, nro 11, s. 1826–1839. PubMed:16345017. doi:10.1002/sim.2376.
- ↑ Robert Makuch, D. H. Freeman, M. F. Johnson: Justification for the lognormal distribution as a model for blood pressure. Journal of Chronic Diseases, 1979, 32. vsk, nro 3, s. 245–250. PubMed:429469. doi:10.1016/0021-9681(79)90070-5.
- ↑ Gabriele Scheler, Johann Schumann: ”Diversity and stability in neuronal output rates”, 36th Society for Neuroscience Meeting, Atlanta. (konferenssijulkaisu) Määritä julkaisija!
- ↑ Kenji Mizuseki, György Buszáki: Preconfigured, skewed distribution of firing rates in the hippocampus and entorhinal cortex. Cell Reports, 12.9.2013, nro 5, s. 1010–1021. PubMed:23994479. PubMed Central:3804159. doi:10.1016/j.celrep.2013.07.039. ISSN 2211-1247.
- ↑ György Buszäki, Menju Mizuseki: The log-dynamic brain: how skewed distributions affect network operations. Nature Reviews. Neuroscience, 6.1.2017, 15. vsk, nro 4, s. 264–278. PubMed:24569488. PubMed Central:4051294. doi:10.1038/nrn3687. ISSN 1471-003X.
- ↑ Adrien wohrer, Mark. D. Humphries, Christian K. Machens: Population-wide distributions of neural activity during perceptual decision-making. Progress in Neurobiology, 1.4.2013, nro 103, s. 156–193. ISSN 1873-5118. PubMed:23123501. PubMed Central:5985929. doi:10.1016/j.pneurobio.2012.09.004.
- ↑ R. J. Oosterbaan, H. P. Ritzema: ”chapter=6: Frequency and Regression Analysis”, Drainage Principles and Applications, Publication 16, s. 175–224. Wageningen, Alankomaat: International Institute for Land Reclamation and Improvement (ILRI), 1994. ISBN 978-90-70754-33-4. Teoksen verkkoversio.
- ↑ Cumulative frequency analysis with probability distribution fitting CumFreq. Viitattu 4.9.2020.
- ↑ Pareto's law of income distribution: Evidence from Germany, the United Kingdom and the United States EconWPA. Viitattu 4.9.2020.
- ↑ Hideki Takayasu (toim); Souma Wataru: ”Physics of Personal Income”, Empire Science of Financial Fluctuations: The Advent of Econophysics. (Konferenssijulkaisu) Springer, 2002. doi:10.1007/978-4-431-66993-7.
- ↑ F. Black, M. Scholes: The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 1973, 81. vsk, nro 3. doi:10.1086/260062.
- ↑ Benoit Mandelbrot: The (mis-)Behaviour of Markets. Basic Books, 2004. ISBN 9780465043552. Teoksen verkkoversio.
- ↑ P. Bunchen: Advamced Option Pricing. University of Sydney, 2007.
- ↑ Mike Thelwall, Paul Wilson: Regression for citation data: An evaluation of different methods. Journal of Infometrics, 2014, 8. vsk, nro 4, s. 963–971. doi:10.1016/j.joi.2014.09.011. arXiv:1510.08877.
- ↑ Paul Sheridan, Taku Onodera: A Preferential Attachment Paradox: How Preferential Attachment Combines with Growth to Produce Networks with Log-normal In-degree Distributions. Scientific Reports, 2018, 8. vsk, nro 1. doi:10.1038/s41598-018-21133-2. arXiv:1703.06645.
- ↑ Patrick O'Connor, Andre Kleyner: Practical Reliability Engineering, s. 35. John Wiley & Sons, 2011. ISBN 978-0-470-97982-2.
- ↑ Shadowing WirelessCommunication.NL. Arkistoitu 13.1.2012. Viitattu 4.9.2020.
- ↑ C. Gros, G. Kaczor, D. Markovic: Neuropsychological constraints to human data production on a global scale. The European Physical Journal B, 2012, 85. vsk, nro 28, s. 28. doi:10.1140/epjb/e2011-20581-3. Bibcode:2012EPJB...85...28G. arXiv:1111.6849.
- ↑ Mohammed Alasmar, George Parisis, Richard G. Clegg, Nickolay Zakhleniuk: On the Distribution of Traffic Volumes in the Internet and its Implications arxiv.org. 11.2.2019. Viitattu 4.9.2020.
Diskreettejä jakaumia | |
---|---|
Jatkuvia jakaumia | |
Moniulotteisia jakaumia |