Wikiprojekti:Avoin kulttuuridata hyötykäyttöön/Tietojen vieminen Wikidataan

oppitunti
Tietojen vieminen Wikidataan
Linkit:

Tällä oppitunnilla käydään läpi prosessi, jossa Wikidatassa olevia tietoja täydennetään ulkoisista lähteistä


Vie tietoja Wikidataan
Tiedon tuonti tai data ingestion on useampien Wikidata-kohteiden lisäämistä tai laajentamista kerrallaan. Tämä opas kertoo kuinka se tehdään.
Ennen kuin aloitat: Varmista, että aineiston metadata on Creative Commons Zero (CC0)
Koska Wikidatan lisenssi on Creative Commons Zero (CC0), ei aineisto voi olla rajatummassa muodossa. Esimerkiksi CC-BY-SA -lisenssi ei käy! Se on käyttöä rajoittava lisenssi ja sen käyttäminen on vastoin Wikimedian missiota tuottaa avointa, uudelleenkäytettävää dataa.
Analysoi data
Ota yksi tai useampia tietueita tarkasteluun ja tutki, mitä kentät merkitsevät. Etsi kenttää, joka voi toimia ensisijaisena avaimena ja kenttää, joka voi toimia otsikkona. Kaikkia alkuperäisen tietueen tietoja ei tarvitse käyttää, eikä sinun tarvitse heti ymmärtää niiden kaikkien merkitystä.
Etsi ainutkertaiset avaimet
Jokaista datan tuontia varten täytyy löytää ainutkertainen avain. Näin voimme päivittää olemassaolevaa tietoa sen sijaan että loisimme aina uusia kopioita joka tuontikerralla. On kahdenlaisia ainutkertaisia avaimia:
  • Yksilölliset ominaisuudet: Ominaisuudet, jotka ovat itsessään ainutkertaisia
  • Yhdistetyt ominaisuudet: Ominaisuus, joka on ainutkertainen omassa ympäristössään. Tämä ominaisuus tarvitsee tarkenteeksi oman ympäristönsä tunnuksen.
Wikidata Queryä voidaan käyttää tekemään hakutaulukko <avain> -> <Wikidata-kohde>
Siivoa olemassaolevia kohteita
Ennen kuin voit tuoda tietoja WIkidataan, tarkista, siivoa ja järjestele olemassaolevia kohteita niin, ettei tuonnissa synny kaksoiskappaleita tai sotkuista tietueiden joukkoa. Tämä koostuu ykeensä seuraavista vaiheista:
  1. Yritä etsiä kaikki aiheeseen kuuluvat kohteet ja lisätä niihin tarvittavia esityksiä, jotta voit käsitellä niitä
  2. Lisää tunnisteet kaikkiin kohteisiisi
  3. Siivoa olemassaolevia kohteita muilla tavoin (valiunnainen)
Botin ohjelmoiminen
Tutustu erikseen botin ohjelmoimiseen, tässä joitakin linkkejä
Multichill aka Maarten Dammers
André Costa, WMSE


Aiheesta muualla muokkaa