Ero sivun ”Lineaarinen regressioanalyysi” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
→‎Oletukset: useampi muuttuja
Rivi 22:
 
* Suuria poikkeavia havaintoja ei ole. Merkittävät poikkeamat vääristävät PNS-menetelmää, koska neliösummat kasvavat poikkeaman koon neliönä, mikä kasvattaa eksponentiaalisesti poikkeamien merkitystä suhteessa niideen suuruuteen. Jos aineistossa esiintyy suuria poikkeamia, on syytä tarkastaa onko kyseessä selvästi mittaus- tai merkintävirhe. Monet regressioanalyysillä analysoitavat suureet sisältävät luonnollisen rajoitteen, esimerkiksi matkustajamäärät eivät voi alittaa 0:aa eivätkä ylittää kulkuneuvon fyysistä kapasiteettia.<ref name="SW"/>
 
* Useamman muuttjan regressioanalyysissä oletetaan, ja itseasiassa analyysin onnistuminen edellyttää, että muuttujien välillä ei ole täydellistä [[multikollineaarisuus|multikollineaarisuutta]] eli että yksi muuttujista olisi täydellisessä lineaarisessa riippuvuussuhteessa toiseen. Yleensä täydellinen multikollineaarisuus on merkki siitä että tavalla tai toisella jokin muuttuja on tullut edustetuksi kaksi kertaa regressioyhtälössä, esimerkiksi eri mittayksiköissä.<ref name="SW"/>
 
Lisäksi voidaan tehdä ns. Gauss-Markov -oletukset: