Ero sivun ”Yleistetty lineaarinen malli” versioiden välillä

[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
Korjattu linkki sivuun Pistemääräfunktio
Boehm (keskustelu | muokkaukset)
typog
Rivi 74:
Kun vastusvaihtoehtoja on kaksi (0 tai 1), vastemuuttujana on positiivisten vasteiden (1) osuus kaikista: <math> Y_i = K_i / m_i </math>. ''K''<sub>i</sub> noudattaa [[binomijakauma|binomijakaumaa]] ''Bin''(''m''<sub>i</sub>, ''л''<sub>i</sub>), jos positiivisen vasteen todennäköisyys ''л''<sub>i</sub> on kiinteä kussakin [[kovariaatti]]luokassa ''m''<sub>i</sub>. Binomijakaumalle ylihajonta on hyvin yleistä, joka johtuu esimerkiksi [[Klusteri|ryvästymisestä]].
Binomivasteen tapauksessa usein käytettyjä linkkifunktioita ovat:
* Logistinen: <math> g(\mu_i) = \log\left(\frac{\mu_i}{1-\mu_i}\right). </math>
* Probit-funktio: <math> \operatorname{g}(\mu_i) = \phi^{-1}(\mu_i). </math> missä ''Ф'' on normeeratun normaalijakauman kertymäfunktio.
* Komplementaarinen log-log –funktio: <math> \operatorname{g}(\mu_i) = \log(-\log(1-\mu_i)). </math>
Yleistetty lineaarinen malli binomisen vasteen tapauksessa on sama kuin logistinen regressiomalli, jos linkkifunktioksi valitaan logistinen linkkifunktio. Logistinen linkkifunktio on myös binomijakauman kanoninen linkki.
 
===Lukumäärävasteet===
Kun vastemuuttuja ''Y''<sub>i</sub> on lukumäärä, joille ei ole määritettävissä ylärajaa, puhutaan lukumäärävasteesta. Tyypillisesti ''Y''<sub>i</sub> on joltain alueelta ja ajanjaksolta havaittujen tapausten määrä. Jos kyseiset tapaukset voidaan olettaa toisistaan riippumattomiksi ja niiden intensiteetti ''λ'' vakioksi, noudattaa lukumäärävaste [[Poisson-jakauma|Poisson-jakaumaa]]. Sopiva linkkifunktio on log.
: <math> \log(\mu_i) = \sum_{j=1}^p x_{ij} \boldsymbol{\beta_j} </math>
Kuten binomijakauman tapauksessakin, ylihajonta on Poisson-jakaumassa yleistä.
 
Lukumäärävasteisiin liittyy keskeisesti käsite offset. Offset on hyödyllinen silloin, kun havaintojen aikaikkuna vaihtelee. Tämä aikaikkunan vaihtelu voidaan huomioida mallissa offsetin avulla. Kun linkkifunktio on logistinen, offset saadaan malliin mukaan:
: <math> \log(\mu_i) = \sum_{j=1}^p x_{ij} \boldsymbol{\beta_j} + \log(t_i) </math>
, jossa ''T''<sub>i</sub> on aikaikkuna.
 
Rivi 96:
Olkoon ''K''<sub>1</sub>, ''K''<sub>2</sub>,…, ''K''<sub>Q</sub> ovat Poisson-jakautuneita satunnaismuuttujia odotusarvoilla ''λ''<sub>1</sub>, ''λ''<sub>2</sub>,…,''λ''<sub>Q</sub>. Summa ''m'' = ''K''<sub>1</sub> + ''K''<sub>2</sub> +…+ ''K''<sub>Q</sub> on Poisson-jakaumaa noudattava satunnaismuuttuja odotusarvolla ''λ'' = ''λ''<sub>1</sub> + ''λ''<sub>2</sub> +…+ ''λ''<sub>Q</sub>. Siten ehdollinen jakauma on multinominaalijakauman muotoinen:
 
: <math> f(k_1,k_2,...,k_Q;m) = \left(\frac{\lambda_1}{\lambda}\right)^{k_1}\left(\frac{\lambda_2}{\lambda}\right)^{k_2} ... \left(\frac{\lambda_Q}{\lambda}\right)^{k_Q} \frac {m!} {k_1!k_2!...k_q!}. </math>
Koska <math>\left(\frac{\lambda_q}{\lambda}\right)^{k_q} = \pi_q </math> kyseessä on multinominaalijakauma.
 
On hyvä huomata, että mallista on jätettävä yksi luokka pois analyysia varten. Tämä poisjätetty luokka toimii ns. vertailuluokkana. Sopiva linkkifunktio lukumäärävasteille on '''logistinen linkki'''.
Rivi 106:
Positiiviselle vasteelle on erilaisia mahdollisia jakaumia. Yksi vaihtoehto on [[Gamma-jakauma]], jolla ''C.V'' on vakio. Gamma-jakaumalle mahdollisia linkkifunktioita ovat:
* Käänteinen linkki: <math> g(\mu_i) = \frac{1}{\mu_i}. </math>
* Log-linkki: <math> \operatorname{g}(\mu_i) = \log(\mu_i). </math>
Käänteinen linkkifunktio on Gamma-jakuman kanoninen linkkifunktio. Tällä linkillä on tarpeen rajoittaa regressiokerrointa ''ß'', ettei sovitteet ole negatiivisia. Log-linkkifunktion kohalla regressiokerrointa ''ß'' ei tarvitse rajoittaa.