Log-normaalijakauma

Log-normaalijakauma[1] eli logaritminormaalijakauma[2] on toden­näköisyys­laskennassa sellaisen jatkuvan satunnaismuuttujan jakauma, jonka logaritmi on normaalisti jakautunut. Toisin sanoen, jos satunnais­muuttuja on log-normaalisti jakautunut, niin on normaalisti jakautunut, ja jos on normaalisti jakautunut, niin on log-normaalisti jakautunut.[2] Log-normaalisti jakautunut satunnais­muuttuja voi saada vain positiivisia reaali­luku­arvoja. Jakauma on käyttökelpoinen malli monille fysikaalisille, teknisille, taloustieteellisille ja muilla aloilla esiintyville muuttujille.

Log-normaalijakauma
Tiheysfunktio
Logaritminormaalijakauman tiheysfunktiota parametrien eri arvoilla
Kertymäfunktio
Logaritminormaalijakauman kertymäfunktioita parametrin σ eri arvoilla, kun μ=0
Merkintä
Parametrit μR
σ2 > 0
Määrittelyjoukko xR
Tiheysfunktio
Kertymäfunktio
Odotusarvo
Mediaani
Moodi
Varianssi
Vinous
Huipukkuus
Entropia
Momentit generoiva funktio määritelty vain luvuille, joilla on ei-positiivinen reaaliosa
Karakteristinen funktio esitys hajaantuu asymptoottisesti, mutta sopii numeeristen likiarvojen laskentaan
Fisherin informaatiomatriisi

Jakaumaa nimitetään toisinaan myös Galtonin jakaumaksi Francis Galtonin mukaan.[3] Muita siihen toisinaan yhdistettyjä nimiä ovat McAlister, Gibrat ja Cobb-Douglas.[3]

Todennäköisyyslaskennan keskeisen raja-arvolauseen mukaan monen riippumattoman satunnaismuuttujan summa noudattaa sitä tarkemmin normaalijakaumaa, mitä enemmän näitä satunnaismuuttujia on. Samaan tapaan tarpeeksi monen toisistaan riippumattoman satunnaismuuttujan tulolla on taipumus noudattaa log-normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on.[4] Log-normaalijakaumalla on myös suurin entropia niistä jakaumista, joilla on tietty odotusarvo ja varianssi.[5]

MääritelmäMuokkaa

Jakauman muodostaminen ja parametritMuokkaa

Olkoon   standardinormaalijakaumaa noudattava satunnaismuuttuja, ja olkoot   ja   kaksi reaalilukua. Silloin satunnais­muuttujan

 

jakaumaa sanotaan log-normaalijakaumaksi parametrein   and  . Nämä parametrit ovat tällöin jakauman luonnollisen logaritmin odotusarvo ja keskihajonta, mutta eivät itse jakauman   odotusarvo ja varianssi.

 
Normaalijakauman ja logaritminormaalijakauman välinen yhteys. Jos   on normaalisti jakautunut, on   logaritminormaalisti jakautunut.

Tämä yhteys pätee logaritmi- tai eksponenttifunktion kantaluvusta riippumatta. Jos   on normaalisti jakautunut, samoin on myös  , olivatpa   ja   mitkä tahansa positiiviset luvut ( . Samoin jos   on log-normaalisti jakautunut, samoin on satunnaismuuttujan   laita, kun  .

Sellaisen jakauman muodostamiseksi, jolla on haluttu odotusarvo   ja varianssi  , on valittava   ja  

Vaihtoehtoisesti voidaan käyttää "multiplikatiivisia" eli "geometrisia" parametreja   ja  . Niillä on suorempi tulkinta:   on jakauman mediaani, ja   liittyy jakauman leviämiseen jäljempänä selitettävällä tavalla.

TiheysfunktioMuokkaa

Positiivinen satunnais­muuttuja X on log-normaalisti jakautunut, jos X:n logaritmi on normaalisti jakautunut, jolloin

 

Olkoon   normaalijakauman N(0,1) kertymäfunktio ja   sen tiheysfunktio. Tällöin saadaan:[2]

 ,

missä esimerkiksi   tarkoittaa todennäköisyyttä sille, että satunnaismuuttujan X arvo on pienempi kuin x.

KertymäfunktioMuokkaa

Log-normaalijakauman kertymäfunktio on

 

missä   on normeeratun normaalijakauman N(0,1) kertymäfunktio.

Virhefunktion   avulla kertymäfunktio voidaan esittää muodossa:

 

missä erfc on komplementaarinen virhefunktio erfc(x) = 1 - erf(x).

Useamman muuttujan lognormaalijakaumaMuokkaa

Jos  on useamman muuttujan normaalijakauma, niin funktio   noudattaa useamman muuttujan logaritmista normaalijakaumaa.[6][7], jonka odotusarvo on

 

ja kovarianssimatriisi

 

Useamman muuttujan logaritminormaalijakauma ei kuitenkaan ole kovin yleisessä käytössä, minkä vuoksi jäljempänä rajoitutaan käsittelemään yhden muuttujan jakaumaa.

Karakteristinen funktio ja momentit generoiva funktioMuokkaa

Logaritmisella normaalijakaumalla on kaikki momentit, ja

 

Tämä voidaan johtaa sijoittamalla integraaliin  . Kuitenkaan odotusarvo   ei ole määritelty millään argumentin   positiivisella arvolla, koska sen määrittelevä integraali hajaantuu. Sen vuoksi logaritmisella normaalijakaumalla ei myöskään ole momentit generoivaa funktiota.[8] Tähän liittyy se, että logaritmisen normaalijakauman momentit eivät yksikäsitteisesti määrittele jakaumaa.

Karakteristinen funktio   on määritelty reaaliarvoille  , mutta ei sellaisille kompleksiluvuille, joilla on negatiivinen imaginaariosa, minkä vuoksi karakteristinen funktio ei ole analyyttinen origossa. Tämän vuoksi logaritmisen normaalijakauman karakteristista funktiota ei voida esittää päättymättömänä suppenevana sarjana.[9] Erityisesti sen muodollinen Taylorin sarja

 

hajaantuu. Funktiolle on kuitenkin voitu muodostaa vaihtoehtoisia hajaantuvia sarjaesityksiä.[9][10][11][12]

Karakteristiselle funktiolle   ei tunneta suljetussa muodossa esitettävää lauseketta. Sille saadaan kuitenkin hyviä likiarvoja lausekkeesta[13]

 

missä   on Lambertin W-funktio. Tämä likiarvo voidaan johtaa asymptoottisella menetelmällä, mutta se pätee likimäärin kaikilla  :n arvoilla, joilla   suppenee.

OminaisuuksiaMuokkaa

Geometriset eli multiplikatiiviset momentitMuokkaa

Logaritmisen normaalijakauman geometrinen eli multiplikatiivinen keskiarvo on  . Se on samalla jakauman mediaani. Jakauman geometrinen eli multiplikatiivinen keskihajonta on  .[14][15] Analogisesti aritmeettisten tilastollisten tunnuslukujen kanssa voidaan määritellä geometrinen varianssi  , ja myös geometrista variaatiokerrointa[14]   on ehdotettu. Viimeksi mainitun olisi tarkoitus olla analoginen tavallisen variaatiokertoimen kanssa lognormaalin aineiston tapauksessa, mutta tällä määritelmällä ei ole sellaista teoreettista perustaa, että sen perusteella voitaisiin arvioida itse variaatiokerrointa  .

On huomattava, että geometrinen keskiarvo on aina pienempi kuin sen aritmeettinen keskiarvo. Tätä tosiasiaa sanotaan aritmeettis-geometriseksi epäyhtälöksi, ja se kuvastaa sitä tosiasiaa, että logaritmi­funktion kuvaaja on ylöspäin kupera. Itse asiassa pätee yhteys

 [16]

Liikealalla termiä   tulkitaan toisinaan kuperuus­korjaukseksi. Stokastisen analyysin kannalta kyseessä on sama korjaus­termi kuin geometrista Brownin liikettä koskevassa Itôn lemmassa.

Aritmeettiset momentitMuokkaa

Kun   on mikä tahansa reaali- tai kompleksiluku, lognormaalisti jakautuneen satunnais­muuttujan   n:s momentti on[3]

 

Erityisesti lognormaalisti jakautuneen satunnaismuuttujan   aritmeettinen keskiarvo, odotusarvo, aritmeettinen varianssi ja aritmeettinen keskihajonta ovat:

 .

Jakauman aritmeettinen variaatiokerroin   määritellään sen keskihajonnan ja keskiarvon suhteena:

 .

Logaritmisen normaalijakauman tapauksessa se on:

 

Tätä tulosta sanotaan joskus "geometriseksi variaatiokertoimeksi" (engl. Geometric coefficient of variation, GCV)[17][18]. Aritmeettisesta keskihajonnasta poiketen se on aritmeettisesta keskiarvosta riippumaton.

Parametrien   ja   arvot voidaan laskea, jos aritmeettinen keskiarvo ja varianssi tunnetaan:

 

Momentit   eivät määritä toden­näköisyys­jakaumaa yksi­käsitteisesti. Toisin sanoen on muitakin jakaumia, joilla on samat momentit. Itse asiassa on koko joukko jakaumia, joilla on samat momentit kuin logaritmisella normaali­jakaumalla.

Moodi, mediaai ja kvantiilitMuokkaa

 
Kahden vinoudeltaan toisistaan poikkeavan logaritmisen normaali­jakauman odotus­arvot, mediaanit ja moodit

Jakauman moodi on piste, jossa sen tiheys­funktio saa suurimman arvonsa. Erityisesti se toteuttaa yhtälön  , josta saadaan:

 

Koska logaritmisesti muunnettu muuttuja   on normaalisti jakautunut ja koska kvantiilit säilyvät monotonisissa muutoksissa, muuttujan   kvantiilit ovat:

 

missä   on standardin normaalijakauman kvantiili.

Erityisesti logaritmisen normaalijakauman mediaani on sama kuin sen geometrinen keskiarvo.[19]

 

Osittainen odotusarvoMuokkaa

Satunnaismuuttujan   osittainen odotusarvo kynnysarvon   suhteen määritellään seuraavasti:

 

Vaihtoehtoisesti se voidaan kirjoittaa ehdollisen odotusarvon avulla muotoon  . Logaritmisen normaalijakauman tapauksessa osittainen odotusarvo on:

 

missä   on normaalijakauman kertymäfunktio. Osittaisen odotusarvon kaavalla on käyttöä vakuutusalalla ja taloustieteessä, ja sen avulla ratkaistaan Black–Scholesin kaavaan johtava osittaisdifferentiaaliyhtälö.

Ehdollinen odotusarvoMuokkaa

Log-normaalin satunnaismuuttujan   ehdollinen odotusarvo kynnysarvon   suhteen on sen osittainen odotusarvo jaettuna sen kumulatiivisella todennäköisyydellä olla tällä välillä:

 

Vaihtoehtoisia parametrointejaMuokkaa

Log-normaalijakauma määritetään tavallisimmin parametrien   tai   avulla, mutta vaihtoehtoisesti se voidaan parametroida useilla muillakin tavoilla. Todennäköisyysjakaumien tietokanta ProbOnto tuntee kaikkiaan seitsemän muuta tapaa parametroida log-normaalijakauma:[20]MH Swat, P. Grenon, S Wimalaratne: ProbOnto: ontology and knowledge base of probability distributions. Bioinformatis, 2016, 32. vsk, nro 17, s. 2719–2721. doi:10.1093/bioinformatics/btw170. </ref>

 
Yhteenveto log-normaalien jakaumien parametroinneista
  • Normal1(μ,σ), parametreina odotusarvo μ ja keskihajonta σ[21]
     
  • LogNormal2(μ,υ), parametreina odotusarvo μ ja varianssi υ, molemmat logaritmisella asteikolla
     
  • LogNormal3(m,σ), paramtreina mediaanim lineaarisella asteikolla ja keskihajonta σ logaritmisella asteikolla
     
  • LogNormal4(m,cv), parametreina mediaani m ja variaatiokerroin cv, molemmat lineaarisella asteikolla
     
  • LogNormal5(μ,τ), parametreina odotusarvo μ ja tarkkuus τ, molemmat logaritmisella asteikolla.[22]
     
  • LogNormal6(m,σg), parametreina mediaani m ja geometrinen keskihajonta σg, molemmat lineaarisella asteikolla[23]
     
  • LogNormal7(μNN), parametreina odotusarvo μN ja keskihajonta σN, molemmat lineaarisella asteikolla[24]
     
Esimerkkejä uudelleenparametroinneistaMuokkaa

Tarkastellaan tilannetta, jossa samaa aineistoa halutaan mallintaa kahdella tavalla käyttämällä kahta erilaista optimointivälinettä, esimerkiksi PFIM[25] and PopED.[26] Näistä edellinen tukee LN2-, jälkimminen LN7-parametrointia. Siksi tarvitaan uudelleenparametrointia, sillä muutoin mallit johtaisivat eri tuloksiin.

Muunnokselle   pätevät kaavat:  .

Muunnokselle   taas pätevät kaavat:  .

Muut uudelleenparametrointikaavat löytyvät ProbOnto -tietokannasta.[20]

Monikerta, käänteisarvo ja potenssitMuokkaa

  • Vakiolla kertominen: Jos  , niin  .
  • Käänteisarvo: If  , niin .
  • Potenssi: If  , niin  , kun  .

Log-normaalisti jakautuneiden satunnaismuuttujien kerto- ja jakolaskuMuokkaa

Jos kaksi riippumatonta log-normaalisti jakautunutta satunnaismuuttujaa,   ja  , kerrotaan keskenään, niiden tulo on sekin log-normaalisti jakautunut, parametreina   ja  , missä  . Tämän avulla voidaan helposti muodostaa useammankin log-normaalin satunnaismuuttujan tulon jakauma: Jos   ovat   riippumatonta, log-normaalisti jakautunutta satunnaismuuttujaa, niin  

Jos taas log-normaalisti jakautunut satunnaismuuttuja  , jonka parametrit ovat   ja  , jaetaan toisella siitä riippumattomalla log-normaalisti jakautuneella satunnaismuuttujalla  , jonka parametrit ovat   ja  , näiden osamäärä on sekin log-normaalisti jakautunut, parametreina   ja  .

Multiplikatiivinen keskeinen raja-arvolauseMuokkaa

Samalla tavalla jakautuneiden riippumattomien positiivisten satunnaismuuttujien   multiplikatiivinen eli geometrinen keskiarvo noudattaa logaritmista normaalijakaumaa sitä tarkemmin, mitä enemmän näitä muuttujia on. Tätä tulosta sanotaan multiplikatiiviseksi keskeiseksi raja-arvolauseeksi, ja se seuraa suoraan todennäköisyyslaskennan keskeisestä raja-arvolauseesta, kun sitä sovelletaan muuttujiin, jotka saadaan alkuperästen satunnaismuuttujien logaritmeina.

MuutaMuokkaa

Log-normaalijakaumaa noudattavalla aineistolla on symmetrinen Lorenzin käyrä.[27]

Jakauman harmoninen ( ), geometrinen ( ) ja aritmeettinen keskiarvo ( ) liittyvät toisiinsa seuraavasti:[28]

 

Log-normaalit jakaumat ovat äärettömästi jaollisia,[29], mutta eivät stabiileja jakaumia.[30]

Yhteydet muihin jakaumiinMuokkaa

  • Jos   on normaalisti jakautunut, niin  
  • Jos   on jakautunut log-normaalisti, niin   on jakautunut normaalisti.
  • Olkoot   riippumattomia log-normaaleja jakaumia, joilla mahdollisesti on erisuuret parametrit   ja  , ja okoon  . Tällöin  :n jakaumaa ei voida esittää suljetussa muodossa, mutta sitä voidaan sen oikeassa päässä approksimoida toisella log-normaalilla jakaumalla  .[31] Sen tiheysfunktion muoto tunnetaan myös 0:n läheisyydessä[30] missä se ei muistuta mitään log-normaalia jakaumaa. Sille saadaan L. F. Fentonin tunnetuksi tekemä, mutta R.I. Wilkinsonin jo aikaisemmin esittämä ja Marlowin matemaattisesti perustelema likiarvo[32]) käyttämällä toisen log-normaalin jakauman keskiarvoa ja varianssia:
 
Jos kaikilla muuttujilla   on sama varianssiparametrin arvo  , nämä kaavat yksinkertaistuvat muotoon
 

Vielä parempia likiarvoja voidaan saada arvioimalla jakauman tiheys- ja kertymäfunktiota Monte Carlo menetelmällä.[33][34]

  • Jos  , niin muuttujan   jakaumaa sanotaan kolmiparametriseksi log-normaaliksi, ja se on jakautunut välille  .[35]  ,  .
  • Log-normaalijakauma on erikoistapaus puolittain rajoitetusta Johnsonin jakaumasta.
  • Jos   with  , niin   (Suzukin jakauma).
  • Lognormaalijakaumalle saadaan likiarvo, jonka integraali voidaan esittää alkeisfunktioiden avulla[36], käyttämällä sen määritelmässä normaalijakauman sijasta logistista jakaumaa. Tällöin jakauman kertymäfunktioksi saadaan:
 
Tämä on log-logistinen jakauma.

Tilastollisia päätelmiäMuokkaa

Parametrien estimointiMuokkaa

Lognormaalijakauman parametrien μ ja σ suurimman uskottavuuden estimaattorien määrittämiseksi voidaan käyttää samaa menetelmää, jolla ne määritellään normaalijakaumalle. Voidaan todeta, että

 ,

missä   on normaalijakauman   tiheysfunktio. Niinpä log-normaalijakauman uskottavuusfunktio on

 .

Koska tässä ensimmäinen termi on vakio μ:n ja σ: suhteen, molemmat logaritmiset uskottavuusfunktiot,   ja  , saavat maksiminsa samoilla  :n ja  :n arvoilla. Niinpä suurimman uskottavuuden estimaattorit ovat samat kuin normaalijakaumalle havaintoarvoilla  ,

 

Äärellisillä n:n arvoilla näillä estimaattoreilla esiintyy systemaattinen virhe. Tämä virhe on tosin  :n osalta häviävän pieni, mutta  :lle saadaan vähemmän vääristynyt arvo korvaamalla  :n yhtälössä nimittäjä n arvolla n-1.

Jos yksittäisiä arvoja   ei tunneta mutta aineiston keskiarvo   ja keskihajonta s tunnetaan, vastaavat parametrit saadaan seuraavista kaavoista, jotka on muodostettu ratkaisemalla   ja   odotusarvon   ja varianssin   yhtälöistä:

 .

Tilastollisia tunnuslukujaMuokkaa

Log-normaalisti jakautunutta aineistoa voidaan tehokkaimmin analysoida soveltamalla logaritmisesti muunnettuun aineistoon normaalijakaumaan perustuvia tunnettuja metodeja ja suorittaa sen jälkeen tuloksille käänteinen muunnos.

HajontavälitMuokkaa

Tyypillisen esimerkin tästä muodostavat hajontavälit. Normaalisti jakautunut satunnaismuuttuja on noin kahden kolmasosan (68 %) todennäköisyydellä välillä   ja noin 95 %:n todennäköisyydellä välillä  . Sen vuoksi log-normaalisti jakautunut satunnaismuuttuja on

välillä   todennäköisyydellä 2/3 ja
välillä   todennäköisyydellä 95 %

Käyttämällä estimoituja parametreja suunnilleen samat prosenttiosuudet log-normaalisti jakautuneesta aineistosta on näillä väleillä.

 :n luottamusväliMuokkaa

Samalla periaatteella todetaan, että  :n luottamusväli on  , missä   on standardipoikkeama ja q Studentin t-jakauman 97,5 prosentin kvantiili, vapausasteluvulla n-1. Käänteisellä muunnoksella saadaan  :n luottamusväliksi

  with  

Entropian ääriarvoperiaate vapaan parametrin   määrittämiseksiMuokkaa

  • Sovelluksissa   on määritettävä parametri. Kasvuproseseissa, joissa tuotto ja häviö tasapainottavat, saadaan Shannonin ääriarvoperiaatetta soveltamalla:
  [37]
  • Tämän arvon avulla voidaan muodostaa skaalausrelaatio lognormaalijakauman maksimikohdan ja käännepisteiden välille.[37] Osoittautuu, että tämän yhteyden määrittää Neperin luku, ja sillä on tiettyjä geometrisia yhtäläisyyksiä minimipintaenergiaperiaatteen kanssa.
  • Nämä skaalausrelaatiot ovat osoittautuneet käyttökelpoisiksi useiden kasvuprosessien ennustamisessa. Sellaisia ovat esimerkiksi epidemioiden leviäminen, kiinteälle pinnalle muodostuvien nestepisaroiden laajeneminen, väestön kasvu, pyörteen syntyminen pesuallasta tyhjennettäessä, kielen piirteiden levinneisyys, turbulenssin nopeusprofiili ja monet muut.
  • Arvon   avulla saadaan probabilistinen ratkaisu Draken epäyhtälölle.[38]

Esiintyminen ja sovelluksiaMuokkaa

Log-normaalijakaumaa voidaan soveltaa moniin luonnonilmiöihin. Tyypillisessä tapauksessa sen käyttö voidaan perustella seuraavasti: Monet luonnon kasvuilmiöt muodostuvat suuresta määrästä pieniä muutoksia, joissa kohteen koko kasvaa pienen prosenttimäärän verran entisestään. Tällaiset muutokset kumuloituvat multiplikatiivisesti, mutta logaritmisella asteikolla additiivisesti. Jos jokaisen yksittäisen muutoksen vaikutus on mitättömän pieni, keskeinen raja-arvolauseen mukaan niiden summan jakauma on lähempänä normaalijakaumaa kuin yksittäisten muutoksen jakauma. Tästä seuraa, että kasvavien kohteiden koon logaritmilla on taipumus noudattaa normaalijakaumaa, jolloin koko itse noudattaa log-normaalijakaumaa. Tosin jos jakauman keskihajonta on tarpeeksi pieni, normaalijakaumaa voidaan käyttää sillekin hyvänä likiarvona.

Tämä keskeisen raja-arvolauseen multiplikatiivinen versio tunnetaan myös Gibratin lakina, Robert Gibratin (1904–1980) mukaan, joka muotoili sen liikeyrityksille.[39] Jos näiden pienten muutosten kertymisnopeus ei vaihtele ajan kuluessa, kasvu tulee koosta riippumattomaksi. Vaikka näin ei tapahtuisikaan, minkä tahansa ajan kuluessa kasvavan suureen jakaumalla on taipumus muodostua logartminormaaliksi.

Toinen perustelu jakauman käytölle on, että perustavien luonnonlakien mukaan monien suureiden arvot saadaan kertomalla ja jakamalla positiivisia muuttujia. Esimerkkeinä voidaan mainita gravitaatiolaki, jonka mukaisesti voima määräytyy kappaleiden massojen ja niiden etäisyyden mukaan, tai kemikaalien konsentraatiot liuoksessa tasapainon vallitessa, jotka määräytyvät lähtöaineiden alkutilanteessa vallinneiden konsentraation mukaan. Tällaisia tilanteita voidaan mallintaa olettamalla, että muuttujat noudattavat logaritmista normaalijakaumaa.

Silloinkin kun edellä esitetyt perustelut eivät päde, logaritminen normaalijakauma on usein uskottava ja empiiristen havaintojen mukaan pätevä malli. Esimerkkeinä voidaan mainita:

  • Ihmisten käyttäytymisestä:
    • Internetin keskustelupalstoille lähetettyjen kommenttien pituuden on todettu noudattavan logaritmista normaalijakaumaa.[40]
    • Aika, jonka käyttäjät pitävät verkosta lukemaansa artikkelia tai uutissivua auki, noudattaa myös logaritmista normaalijakaumaa.[41]
    • Shakkipelierien kestolla on taipumus noudattaa logaritmista normaalijakaumaa.[42]
    • Vääntöjen lukumäärä Rubikin kuutiota ratkaistaessa, sekä yleisesti että kullakin ratkaisijalla erikseen, näyttää noudattavan log-normaalia jakaumaa.[43]
  • Biologian ja lääketieteen alalta:
    • Elävien kudosten mitat kuten pituus, nahan pinta-ala ja paino.[44]
    • Nopeasti leviävissä epidemioissa kuten SARS:issa vuonna 2003 sairaalassa hoidettujen tapausten lukumäärän on voitu todeta noudattavan log-normaalijakaumaa ilman vapaita parametreja, jos entropialla on tunnettu arvio ja keskihajonta voidaa määrittää entropian tuotannon maksimiperiaatteella.[45]
    • Karvojen, kynsien ja hampaiden pituus niiden kasvusuunnassa noudattaa log-normaalijakaumaa.
    • Normalisoitu RNA-sekvenssin pituutta millä tahansa genomialueella voidaan hyvin approksimoida log-normaalijakaumalla.
    • Tietyt fysiologiset mittaustulokset kuten aikuisten ihmisten verenpaine noudattavat log-normaalijakaumaa, erikseen miehillä ja naisilla.[46]
    • Neurotieteissä ärsykkeiden kulkua neuronien välillä approksimoidaan usein log-normaalijakaumalla. Tämä havaittiin ensin aivokuoressa ja aivojuoviossa[47], myöhemmin myös hippokampuksessa[48] ja muualla aivoissa.[49][50]

Tämän vuoksi terveiltä henkilöiltä tehtyjen mittausten viitearvot voidaan asianmukaisemmin määritellä olettamalla suureiden noudattavan logaritmista normaalijakaumaa kuin olettamalla niiden jakautuneen symmetrisesti keskiarvon molemmin puolin.

 
Eri vuosien suurimmat yhdessä päivässä saadut sademäärät sovitettuina kumulatiiviseen logaritminormaalijakaumaan
  • Hydrologiassa logaritmista normaalijakaumaa käytetään mallinnettaessa esimerkiksi kuukauden tai vuoden suurinta yhdessä päivässä tullutta sademäärää tai jokien virtaamaa.[51]
Oikealla oleva CumFreq:illä tehty kuva esittää esimerkkiä log-normaalijakauman sovittamisesta eri vuosien suurimpiin yhden päivän sademääriin, ja se osoittaa myös binomijakaumaan perustuvan 90%:n luottamusvälin.[52]
Sadanta-aineistoa kuvaa kaavioon merkityt pisteet osana kumulatiivista frekvenssianalyysiä.
  • Yhteiskuntatieteissä ja demografiassa:
    • Todisteet viittaavat siihen, että väestön valtaosan (97%–99%) tulot ovat jakautuneet log-normaalisti.[53] (Sitä vastoin kaikkein suurituloisimpien tulot noudattavat Pareton jakaumaa.[54]
    • Finanssialalla, varsinkin Black–Scholes-mallissa vaihtokurssien, hintaindeksien ja osakekurssi-indeksien muutosten logaritmien oletetaan olevan normaalisti jakautuneet.[55] Nämä muuttujat nimittäin käyttäytyvät kuin koronkorko, eivät yksinkertaisen koron tavoin, ja ovat näin ollen multiplikatiivisia. Kuitenkin jotkut matemaatikot kuten Benoit Mandelbrot ovat väittäneet[56], että logaritminen Lévyn jakauma raskaine "häntineen" olisi parempi malli varsinkin pörssiromahdusten analysointiin. Itse asiassa osakekurssien jakaumilla usein on paksu "häntä".[57] Tämä pörssiromahduksia kuvaava paksuhäntäinen jakauma ei toteuta keskeisen raja-arvolauseen edellytyksiä.
    • Skientometriikassa on todettu, että tieteellisiin artikkeleihin tai patentteihin tehtyjen viittausten lukumäärä nopudattaa diskreettiä log-normaalia jakaumaa.[58][59]
    • Kaupunkien asukaslukujen on väitetty noudattavan log-normaalijakaumaa.
  • Teknologiassa
    • Luotettavuusanalyysissä lognormaalijakaumaa käytetään usein mallina sille, kuinka monta kertaa ylläpidettävää systeemiä on korjattava.[60]
    • Langattomassa tiedonsiirrossa paikallinen keskiteho ilmaistuna logaritmisella asteikolla kuten desibeleinä tai nepereinä noudattaa normaalijakaumaa.[61] Myös suurten rakennusten ja kukkuloiden radiosignaaleille aiheuttamaa varjostusta mallinnetaan usein log-normaalijakaumalla.
    • Julkisesti saatavilla olevien video- ja äänitiedostojen koko noudattaa log-normaalijakaumaa viiden suuruusluokan välillä.[62]
    • Tietokoneverkoissa ja Internet-tietoliikenteen analyysissä log-normaalijakauma on osoittautunut hyväksi tilastolliseksi malliksi liikenteen määrälle aikayksikköä kohti. Tämä on todettu soveltamalla tehokasta tilastollista lähestymistä suuriin ryhmiin todellisia Internet-jälkiä. Tässä yhteydessä log-normaalijakauman on todettu toimivan hyvin kahdessa tärkeässä käyttöyhteydessä: (1) ennakoitaessa sitä, kuinka suuren osan ajastaan liikenne ylittää tietyn rajan (palvelutasosopimuksissa tai linkin kapasiteetin arvioinnissa) sekä (2) ennustettaessa 95 %:n kvantiilihinnoittelua.[63]
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Log-normal distribution

LähteetMuokkaa

  1. Pentti Laininen: ”Tärkeitä jatkuvia jakaumismalleja”, Todennäköisyys ja sen tilastollinen soveltaminen, s. 96. Otatieto, 2001. ISBN 951-672312-8.
  2. a b c Pekka Tuominen, Pekka Norlamo: ”Satunnaismuuttujien yleistä teoriaa”, Todennäköisyyslaskenta, osa 2, s. 323. Limes ry, 1978. ISBN 951-745-023-0.
  3. a b c Norman L. Johnson, Samuel Kotz, N. Balakrishnan: ”Lognormal Distributions”, Continuous univariate distributions. Vol. 1. 2. painos. New York: John Wiley & Sons, 1994. ISBN 978-0-471-58495-7.
  4. Log Normal Distribution Wolfram MathWorld. Eric W. Weisstein. Viitattu 4.9.2020.
  5. Sung Y. Park, Anil K. Bera: Journal of Econometrics, 2009, 150. vsk, nro 2, s. 219–230. doi:10.1016/j.jeconom.2008.12.014. Artikkelin verkkoversio.
  6. Ghasem Tarmast, Statistics Department, Faculty of Mathematical Science and Computer, Shahid Chamran University: Multivariate Log-Normal Distribution (PDF) isi.cbs.nl. 2001. Viitattu 4.9.2020.
  7. Leigh J. Halliwell: The Lognormal Random Multivariate casact.org. 2015. Viitattu 4.9.2020.
  8. CC. Heyde: On a property of the lognormal distribution. Journal of the Royal Statistical Society, Series B, 1963, 25. vsk, nro 2, s. 392–393. ISBN 978-1-4419-5822-8. doi:10.1007/978-1-4419-5823-5_6.
  9. a b P. Holgate: The lognormal characteristic function. Communications in Statistics – Theory and Methods, 1989, 18. vsk, nro 12, s. 4539–4548. doi:10.1080/03610928908830173.
  10. R. Barakat: Sums of independent lognormally distributed random variables. Journal of the Optica Society of America, 1976, 66. vsk, nro 3, s. 211–216. doi:10.1364/JOSA.66.000211.
  11. E. Barouch, GM. Kaufman, ML. Glasser: Studies in Applied Mathematics, 1986, 75. vsk, nro 1, s. 37–55. doi:10.1002/sapm198675137. Artikkelin verkkoversio.
  12. Roy B. Leipnik: On Lognormal Random Variables: I – The Characteristic Function. Journal of the Australian Mathematical Society Series B, Tammikuu 1991, 32. vsk, nro 3, s. 327–347. doi:10.1017/S0334270000006901. Artikkelin verkkoversio.
  13. S. Asmussen, J.L. Jensen, L. Rojas-Nandayapa: On the Laplace transform of the Lognormal distribution. [ Methodology and Computing in Applied Probability, 2014, 18. vsk, nro 2, s. 441-458. Artikkelin verkkoversio.
  14. a b Thomas BL Kirkwood: Geometric means and measures of dispersion. Biometrics, 1979, 35. vsk, nro 4, s. 908–909.
  15. E. Limpert, W. Stahel, M. Abbt: Lognormal distributions across the sciences: keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
  16. Onset-Duration Matching of Acoustic Stimuli Revisited: Conventional Arithmetic vs. Proposed Geometric Measures of Accuracy and Precision. Frontiers in Psychology, 2017, nro 7. doi:10.3389/fpsyg.2016.02013.
  17. FAQ: Issues with Efficacy Analysis of Clinical Trial Data Using SAS PharmaSUG2011. Viitattu 4.9.2020.
  18. MH Schiff: Head-to-head, randomised, crossover study of oral versus subcutaneous methotrexate in patients with rheumatoid arthritis: drug-exposure limitations of oral methotrexate at doses >=15 mg may be overcome with subcutaneous administration. Ann Rheum Dis, 2014, 73. vsk, nro 8, s. 1–3. doi:10.1136/annrheumdis-2014-205228.
  19. Leslie E. Daly, Geoffrey Joseph Bourke: Interpretation and uses of medical statistics. (5th edition) Journal of Epidemiology and Community Health, 2000, 46. vsk, nro 3. Wiley-Blackwell. doi:10.1002/9780470696750.
  20. a b ProbOnto probonto.org. Viitattu 4.9.2020.
  21. Forbes et al.: Probability Distributions. John Wiley & Sons Inc., 2011.
  22. D. Lunn: The BUGS book: a practial introduction to Bayesian analysis. Texts in statistical science, 2012. CRC Press.
  23. E. Limpert, W. Stahel. M. Abbt: Log-normal distributions across the sciences: Keys and clues. BioScience, 2001, 51. vsk, nro 5, s. 341–352. doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
  24. J. Nyberg: PopED - An extended, parallelized, population optimal design tool. Comput Methods Programs Biomed, 2012, 108. vsk, nro 2, s. 789–805. doi:10.1016/j.cmpb.2012.05.005.
  25. S. Retout, S. Duffull, F. Mentré: Development and implementation of the population Fisher information matrix for the evaluation of population pharmacokinetic designs. Comp Meth Pro Biomed, 2001, 65. vsk, nro 2, s. 141–151. doi:10.1016/S0169-2607(00)00117-6.
  26. PopED Manual, Release version 2.13. Technical report. PopED:n kehitystiimi, Uppsalan yliopisto, 2016.
  27. Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. Ecology, 2000, 81. vsk, nro 4, s. 1139–1142. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2.
  28. Lewis A. Rossman: Design stream flows based on harmonic means. Journal of Hydraulic Engineering, Heinäkuu 1990, 116. vsk, nro 7, s. 946–950. doi:10.1061/(ASCE)0733-9429(1990)116:7(946).
  29. Olof Thorin: On the infinite divisibility of the lognormal distribution. Scandinavian Actuarial Journal, 1977, nro 3, s. 121–148. doi:10.1080/03461238.1977.10405635.
  30. a b Gao Xin: Asymptotic Behavior of Tail Density for Sum of Correlated Lognormal Variables. International Journal of Mathematics and Mathematical Sciences, 2009, s. 1–28. doi:10.1155/2009/630857.
  31. S Asmussen, L. Rojas-Nandayapa: Asymptotics of Sums of Lognormal Random Variables with Gaussian Copula. Statistics and Probability Letters, 2008, 78. vsk, nro 16, s. 2709–2714. doi:10.1016/j.spl.2008.03.035. Artikkelin verkkoversio.
  32. N. A. Marlow: A normal limit theorem for power sums of independent normal random variables. Bell System Technical Journal, Marraskuu 1967, 46. vsk, nro 9, s. 2081–2089. doi:10.1002/j.1538-7305.1967.tb04244.x.
  33. Z I Botev, P. L'Ecuyer: ”Accurate computation of the right tail of the sum of dependent log-normal variates”, 2017 Winter Simulation Conference (WSC), s. 1880–1890. Las Vegasissa 3.-6.12.2017 pidetyn konferenssin julkaisu. IEEE, 2017. ISBN 978-1-5386-3428-8. doi:10.1109/WSC.2017.8247924.
  34. Orthonormal polynomial expansions and lognormal sum densities Cornell University. Viitattu 4.9.2020.
  35. B. Sangal, A. Biswas: The 3-Parameter Lognormal Distribution Applications in Hydrology. Water Resources Research, 1970, 6. vsk, nro 2, s. 505–515. doi:10.1029/WR006i002p00505.
  36. P. K. Swanee: Near Lognormal Distribution. Journal of Hydrologic Engineering, 2002, 7. vsk, nro 6, s. 441–444. doi:10.1061/(ASCE)1084-0699(2002)7:6(441).
  37. a b Wu Ziniu, Li Juan, Bai Chenyuan: Scaling Relations of Lognormal Type Growth Process with an Extremal Principle of Entropy. Entropy, {{{Vuosi}}}, 19. vsk, nro 56, s. 1–14. doi:10.3390/e19020056. Artikkelin verkkoversio.
  38. Frederck Bloetscher: Using predictive Bayesian Monte Carlo- Markov Chain methods to provide a probabilistic solution for the Drake equation. Acta Astronautica, 2019, nro 155, s. 118–130. doi:10.1016/j.actaastro.2018.11.033.
  39. John Sutton: Gibrat's Legacy. Journal of Economic Literature, Maaliskuu 1997, 32. vsk, nro 1, s. 40–59.
  40. Pawel Sobkowicz: Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law?. EPJ Data Science, 2013.
  41. Silence is also evidence: interpreting dwell time for recommendation from psychological perspective (konferenssijulkaisu, ACM International Conference on KDD) mldm.ict.ac.cn. 2013. Viitattu 4.9.2020.
  42. What is the average length of a game of chess? chess.stackexchange.com. Viitattu 4.9.2020.
  43. Rubik's Cube Competitors' Mean times from 2019 competitions reddit.com. 21.8.2019. Viitattu 4.9.2020.
  44. Julian S. Huxley: Problems of relative growth. Lontoo, 1932. ISBN 978-0-486-61114-3.
  45. Jennifer S. K. Chan, Philip L. H. Yu: Modelling SARS data using threshold geometric process. Statistics in Medicine, 2006, 25. vsk, nro 11, s. 1826–1839. doi:10.1002/sim.2376.
  46. Robert Makuch, D. H. Freeman, M. F. Johnson: Journal of Chronic Diseases, 1979, 32. vsk, nro 3, s. 245–250. doi:10.1016/0021-9681(79)90070-5.
  47. Gabriele Scheler, Johann Schumann: ”Diversity and stability in neuronal output rates”, 36th Society for Neuroscience Meeting, Atlanta. konferenssijulkaisu. {{{Julkaisija}}}, 2006.
  48. Kenji Mizuseki, György Buszáki: Preconfigured, skewed distribution of firing rates in the hippocampus and entorhinal cortex. Cell Reports, 12.9.2013, nro 5, s. 1010–1021. doi:10.1016/j.celrep.2013.07.039.
  49. György Buszäki, Menju Mizuseki: The log-dynamic brain: how skewed distributions affect network operations. Nature Reviews. Neuroscience, 6.1.2017, 15. vsk, nro 4, s. 264–278. doi:10.1038/nrn3687.
  50. Adrien wohrer, Mark. D. Humphries, Christian K. Machens: Population-wide distributions of neural activity during perceptual decision-making. Progress in Neurobiology, 1.4.2013, nro 103, s. 156–193. ISSN 1873-5118. doi:10.1016/j.pneurobio.2012.09.004.
  51. R. J. Oosterbaan, H. P. Ritzema: ”chapter=6: Frequency and Regression Analysis”, Drainage Principles and Applications, Publication 16, s. 175–224. Wageningen, Alankomaat: International Institute for Land Reclamation and Improvement (ILRI), 1994. ISBN 978-90-70754-33-4. Teoksen verkkoversio.
  52. Cumulative frequency analysis with probability distribution fitting CumFreq. Viitattu 4.9.2020.
  53. Pareto's law of income distribution: Evidence from Germany, the United Kingdom and the United States EconWPA. Viitattu 4.9.2020.
  54. Hideki Takayasu (toim); Souma Wataru: ”Physics of Personal Income”, Empire Science of Financial Fluctuations: The Advent of Econophysics. Konferenssijulkaisu. Springer, 2002. doi:10.1007/978-4-431-66993-7.
  55. F. Black, M. Scholes: The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 1973, 81. vsk, nro 3. doi:10.1086/260062.
  56. Benoit Mandelbrot: The (mis-)Behaviour of Markets. Basic Books, 2004. ISBN 9780465043552. Teoksen verkkoversio.
  57. P. Bunchen: Advamced Option Pricing. University of Sydney, 2007.
  58. Mike Thelwall, Paul Wilson: Regression for citation data: An evaluation of different methods. Journal of Infometrics, 2014, 8. vsk, nro 4, s. 963–971. doi:10.1016/j.joi.2014.09.011.
  59. Paul Sheridan, Taku Onodera: A Preferential Attachment Paradox: How Preferential Attachment Combines with Growth to Produce Networks with Log-normal In-degree Distributions. Scientific Reports, 2018, 8. vsk, nro 1. doi:10.1038/s41598-018-21133-2.
  60. Patrick O'Connor, Andre Kleyner: Practical Reliability Engineering, s. 35. John Wiley & Sons, 2011. ISBN 978-0-470-97982-2.
  61. Shadowing WirelessCommunication.NL. Viitattu 4.9.2020.
  62. C. Gros, G. Kaczor, D. Markovic: Neuropsychological constraints to human data production on a global scale. The European Physical Journal B, 2012, 85. vsk, nro 28, s. 28. doi:10.1140/epjb/e2011-20581-3.
  63. Mohammed Alasmar, George Parisis, Richard G. Clegg, Nickolay Zakhleniuk: On the Distribution of Traffic Volumes in the Internet and its Implications arxiv.org. 11.2.2019. Viitattu 4.9.2020.