Wikipedia:Lupaavat artikkelit/Luokitteluehdotus

Lupaavien artikkeleiden määrän kasvaessa on tullut ajankohtaiseksi miettiä niiden organisointia. Wikipedia:Lupaavat artikkelit -sivu on jo tällä hetkellä aika pitkä ja linkkimäärän edelleen kasvaessa tiedon löytäminen sivulta ja listan ylläpitäminen muuttuu kokoajan hankalammaksi.

Tämän sivun on tarkoitus toimia avauksena sen pohtimiselle miten artikkelit voitaisiin käsin ylläpidetyn listan sijaan luokitella.

ToDoMuokkaa

OrganisointiehdotusMuokkaa

  • Käsin ylläpidettävän Lupaavat artikkelit -listan sijaan artikkelit arvioinnin yhteydessä artikkelit luokiteltaisiin.
  • Luokituksen perusteella tehtäisiin automaattisesti päivittyviä listoja jotka vastaavat nykyistä lupaavat artikkelit sivua.
Luokituksista
  • Tehtävä luokkahierarkia olisi irrallaan nykyisestä pääluokituksesta.
  • Luokittelu olisi yleisen kymmenluokittelun tyyppinen ja jossa:
  • Luokkien määrää ja hierarkian syvyyttä pidettäisiin minimaalisena. Uusia luokkia lisättäisiin vain harkiten.
  • Pääpiirteissään luokitukset noudattaisivat jotain yleisesti käytössä olevaa luokittelua. Esimerkiksi yleisten kirjastojen luokitusjärjestelmän luokituksia tai Deweyn luokittelua.
  • Luokkien nimet olisivat muotoa "29.51 Itä-Aasian uskonnot ja mytologiat" tai pelkästään numeroita, joka estää nimitörmäykset nykyisten luokkien kanssa.
  • Artikkelit ja luokat luokiteltaisiin ainoastaan yhteen yläluokkaan.

Hyvät puoletMuokkaa

  • Kymmenluokittelu on yksinkertainen ja helppo hahmottaa
  • Skaalautuu hyvin ja on silti käsin ylläpidettävissä
  • Luokituksista löytyy useita esimerkkejä
  • Yleisesti käytössä olevan luokituksen käyttö helpottaa Wikipedian sisällön vertaamista muihin sisältöarkistoihin.
  • Kymmenluokitukset ovat helposti ohjelmallisesti tulkittavissa.

Huonot puoletMuokkaa

  • Ehdotuksen ideana on luoda rinnakkainen luokitusjärjestelmä nykyisen luokituksen kanssa (vrt tynkäluokat)
  • Artikkelit liittyvät hyvin harvoin ainoastaan yhteen asiaan ja luokitteleminen ainoastaan yhteen luokkaan yksinkertaistaa asioita rankasti
  • Kymmenluokituksiin on hankala jälkikäteen lisätä kokonaan uusia aihepiirejä.

Olemassa olevia luokitusjärjestelmiäMuokkaa

Vaikka kymmenluokitus on ideana vapaa, niin eri tahojen käyttämät metadatat ja luokkahierarkiat ovat niitä ylläpitävien tahojen omistamia eivätkä välttämättä sovellu tekijänoikeudellisesti Wikipedian käyttöön. Toisaalta todennäköisesti tehtävä luokittelu on sen verran pienimuotoista ettei luokkahierarkioiden tekijänoikeuskysymykset ole missään vaiheessa olennaisia vaikka jotain tiettyä mallina käyttäisimmekin.

Dewey Decimal Classification (DDC)Muokkaa

  • Julkaissut alunperin Melvil Dewey vuonna 1876.
  • Deweyn luokitus on käytetyin yksittäinen luokitusjärjestelmä maailmassa.
  • Luokitukset ovat muotoa: 364.168
  • Deweyn luokittelun nykyversion omistaa OCLC Online Computer Library Center, Inc. ja se on julkaistu Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported -lisenssin alaisena. [1]
  • Ei voi käyttää suoraan wikipediassa; OCLC:llä ja kirjasto-/nettiyhteisöillä on ollut ongelmia lisensoinnin suhteen.
  • Itse numerot eivät ole suojattua, ainoastaan numero->nimi yhdistelmät. [2]
  • 000-999 tasosta on olemassa vapaa Free decimal correspondence, [3]
  • LibraryThing käyttää FDC:hen perustuvaa omaa Melvil Decimal System:ään. (lisenssi tuntematon)

Yleinen kirjastoluokitusjärjestelmä (YKL)Muokkaa

  • Käytössä suomen yleisissä kirjastoissa
  • Luokitukset ovat muotoa 36.168
  • Kotisivut: Verkko-YKL
  • Omistajana opetusministeriö. Lisenssipolitiikka ja suhtautuminen copyleft-lisensointiin tuntematon.

Helsingin kaupunginkirjaston luokitusjärjestelmäMuokkaa

British library:n luokitusjärjestelmäMuokkaa

  • British Library on julkaissut luettelointitietonsa avoimena datana, joka käytännössä tarkoittaa koko heidän kansallisbibliografiaa. [5]
  • Www-haku käyttää kirjoissa yhtä dewey luokitusta ja/tai selväkielisiä kategorialuokkia.
  • Lisensointi: Creative Commons CC0 1.0 Universal Public Domain Dedication licence [6]
    • Olisiko British Libraryn julkaiseman datasetin pohjalta luotu Deweyn luokittelu tekijänoikeuksiltaan vapaa ja Wikipedialle sopiva?

UDK (Universal Decimal Classification, UDC)Muokkaa

  • Käytössä tieteellisissä kirjastoissa
  • Kotisivut: http://www.udcc.org/
  • Omistajana UDC Consortium. UDC Summary joka sisältää 2000 luokkaa on julkaistu Creative Commons Attribution Share Alike 3.0 -lisenssin alaisena.

KategoriatMuokkaa

TulevaisuusMuokkaa

Mikäli luokitukset toimivat lupaavien artikkeleiden kohdalla hyvin niin myöhemmin voitaisiin luokitella myös hyvät ja suositellut artikkelit jolloin saadaan ns. kunnossa olevat artikkelit aihekohtaiseksi hakemistoksi.

Nykyisen pääluokituksen ongelmiaMuokkaa

 
Osa luokista joihin Mihaela Loghin kuuluu.

Nykyisen pääluokituksessa yksittäisillä tasoilla ylä- ja alaluokat liittyvät toisiinsa ja ovat loogisia, mutta vapaamuotoisen yhdistelyn tuloksena lopputulos on hankalasti ennustettavissa joka tekee tiedon automatisoidun käsittelyn vaikeaksi.

Esimerkiksi pääluokituksessa romanialainen yleisurheilija Mihaela Loghin löytyy alaluokkien kautta luokkien geotieteet, automaatio, politiikka tai korkeakoulutus alta. (ks. esimerkkikuva). Toinen ennustamattomuutta lisäävä seikka on, että artikkeleista on luokiteltu suoraan luokkiin ja osa artikkelikohtaisten meta-luokkien avulla (vrt Martti Suosalo vs Ismo Alanko ja Ismo Alanko -luokka).

Lisäksi nykyisten luokkien runsaus ja hajanaisuus tekee artikkeleiden löytämisestä luokkien avulla hankalaa. Ongelmista huolimatta luokkahierarkia on kuitenkin niin suuri, ettei mitään nopeaa muutosta luokituksen perusrakenteeseen ole tiedossa.

Aiheesta muuallaMuokkaa