Paneeliaineisto on tilastotieteessä ja erityisesti ekonometriassa käytetty termi aineistolle, jossa havaintoyksiköistä on useita havaintoja[1]. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, yksilöitä, kaupunkeja tai maita. Paneeliaineistossa on useita havaintoja näistä yksiköistä, tyypillisesti eri ajan hetkiltä esimerkiksi vuosittain. Tällöin yksittäisen vuoden havainnot muodostavat poikkileikkausaineiston ja kustakin yksiköstä on aikasarja. Kyseessä voi olla rekisteriaineisto tai satunnaisotannalla poimittu joukko yksilöitä. Taloustieteen ulkopuolella käytetty nimitys paneeliaineistolle on pitkittäisaineisto[1].

Paneeliaineistoilla on useita etuja poikkileikkausaineistoihin nähden. Se mahdollistaa kausaalivaikutusten estimoinnin ilman instrumenttimuuttujia. Lisäksi paneeliaineistolla voi tutkia erilaisia dynaamisia vaikutuksia sekä mahdollistaa havaintoyksiköiden erilaisuus laajemmin.[1] Esimerkiksi kaksostutkimusten avulla voidaan tutkia ympäristön vaikutusta yksilöiden lopputulemiin (kuten koulutus tai tulot). Vertailemalla eri ympäristöissä kasvaneita kaksosia keskenään voidaan sulkea geneettiset vaikutukset näihin lopputulemiin. Tällöin erot kaksosten ympäristöissä voidaan tulkita aiheuttavan erot lopputulemissa.

Kiertävä paneeli on paneeliaineisto, jossa osa havaintoyksiköistä vaihtuu ajan kuluessa[1]. Näin ollen havaintoyksikön aikasarja on lyhyempi kuin aineiston koko aikaulottuvuusselvennä. Jos aineistossa on enemmän kuin kaksi ulottuvuutta, sanotaan aineistoa moniulotteiseksi paneeliksi.

Määritelmä muokkaa

Paneeliainesto on koostuu havaintoyksiköistä   joista on   havaintoa. Yleisimmin   on aikayksikkö, mutta havainnot voivat myös koostua ryhmistä. Havaintoyksiköt voivat olla esimerkiksi yrityksiä, joista on   työntekijää eli havaintoa.

Jokaisella havainnolla on paneeliaineistossa siis kaksi indeksiä, yksikkö ja aika (tai ryhmä). Yksittäinen havainto voi koostua useammasta muuttujasta, jotka jaotellaan vaste- ja kontrollimuuttujiin:  . Yksilöistä koostuvassa aineistossa muuttujat voivat esimerkiksi olla tulot, koulutus, sukupuoli ja ikä. Paneeliaineisto on tasapainoinen, jos jokaisesta yksiköstä on havainto jokaisella ajan hetkellä. Tällöin havaintoja on   kaikille havaintoyksiköille ja havaintoja on yhteensä  .

Esimerkki muokkaa

Paneeliaineisto kolmen henkilön tuloista
Henkilö Vuosi Tulot (€) Työpaikka
1 2010 40 000 A
1 2011 45 000 B
2 2010 60 000 B
2 2011 68 000 A
3 2010 22 000 B
3 2011 20 000 B

Ylläolevassa esimerkissä on kolmen henkilön paneeliaineisto kahdelta vuodelta. Paneeli on tasapainoinen, sillä siinä on yhtä monta havaintoa jokaiselle ajan hetkelle. Paneelia voisi käyttää estimoimaan työpaikan vaikutusta palkkaan. Tällöin tulee olettaa, että työpaikan vaihdos ja vuosi ovat ainoat tekijät, jotka vaikuttavat yksilöiden palkkaan.

Analyysi muokkaa

Paneeliaineistoja käytetään taloustieteessä tyypillisesti kausaalivaikutusten estimointiin. Eri menetelmissä on tavoitteena päästä eroon puuttuvan muuttujan harhasta valitsemalla yksiköille sopivat verrokkiryhmät. Tyypillisesti käytettäviä menetelmiä on:

Vaikutusten estimoimiseksi tutkijan on tehtävä oletuksia vaikutusten luonteesta. Tyypillinen malli paneeliregressiota varten on  , missä   on ajasta riippumaton vakiotermi yksikölle  . Tässä yksinkertaisessa mallissa on jo oletettu vakiotermin olemassaolo sekä vaikutusten lineaarisuus ja additiivisuus.

Kirjallisuutta muokkaa

  • Angrist, Joshua & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press, 2009.
  • Cunningham, Scott: Causal Inference: The Mixtape (v. 1.8). Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)
  • Hansen, Bruce E.: Econometrics, Käsikirjoitus, 2020. Teoksen verkkoversio (Arkistoitu – Internet Archive)

Lähteet muokkaa

  1. a b c d Hansen, Bruce E.: Econometrics, s. 586. Käsikirjoitus, 2020. Teoksen verkkoversio. (Arkistoitu – Internet Archive)
  2. a b Angrist, Joshu & Pischke, Jörn-Steffen: Mostly Harmless Econometrics: An Empirist's Companion, s. 221. Princeton University Press, 2009.