Ero sivun ”Tiedonpakkaus” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
Vuo (keskustelu | muokkaukset)
Joell (keskustelu | muokkaukset)
Parannettu hiukan kieltä ja täsmennetty hiukan epämääräisiä kohtia.
Rivi 1:
[[Tietojenkäsittelytiede|Tietojenkäsittelytieteessä]] tiedon '''pakkaamisella''' tai '''tiivistämisellä''' tarkoitetaan jotakin menetelmää, jonka avulla tietoaineksen kuvaus korvataan lyhyemmällä kuvauksella. EsimerkiksiKuvaus suomenvoi kielenolla lausehäviöllinen "<tt>''Ulla''tai leipoihäviötön p''ulla''n</tt>"riippuen voidaan kuvata tiiviimmässä muodossa "<tt>''G'' leipoi p''G''n</tt>"siitä, josmuuttuuko sovitaan,tietoaineksen ettäsisältö merkkijonokäsittelyn ''ulla''yhteydessä korvataan merkillä ''G'', jokavai ei ennalta esiinny tekstissä.
 
Tietoaineksen tiivistäminen on mahdollista, koska lähes kaikki tallennettava informaatio on ''tilastollisesti redudanttia'' eli se sisältää vähemmän todellista informaatiota kuin sen kuvaamiseen on käytetty. Useimmissa merkistöissä, kuten ASCIIssa, jokainen kirjain kuvataan samalla bittimäärällä. Toisaalta kirjainten esiintymistiheydet eroavat suurestikin, esimerkiksi [[suomen kieli|suomen kielessä]] kirjain 'k' on huomattavasti yleisempi kuin kirjain 'g'. Voidaan myös huomata, että on todennäköisempää, että [[vokaali]]a seuraa [[konsonantti]] kuin toinen [[vokaali]]. Kun nämä havainnot tehdään tilastollisin menetelmin tiivistettäväksi tarkoitetusta datasta, saadaan täsmällistä tietoa, jota varsinainen pakkaus[[algoritmi]] hyödyntää.
Rivi 7:
==Häviötön ja häviöllinen pakkaus==
 
Häviötön pakkausmenetelmä tarkoittaa, että todellista tietoainestatietoaines ei häviämuutu lopullisesti vaan se kuvataan toisella tavalla pakkaamisen yhteydessä. Kun pakkaus puretaan, saadaan alkuperäinen tietoaines. Häviötön pakkaus ontuottaa mahdollistaalkuperäistä vainpienemmän tietoaineksen silloin, joskun pakattava data eisisältää oleriittävästi satunnaistaredudanssia. vaanMerkkejä sisältääsuuresta redudanssista ovat esimerkiksi toistuvat merkkijonot tai toistoaennustettavuus. Yksinkertaisin tilastollinen pakkaus, Huffman-pakkaus[[Huffmanin koodaus]], perustuu siihen että useammin esiintyviä symboleja merkitään lyhyemmällä symbolilla.
 
Häviöllisessä pakkausmenetelmässä sen sijaan tietoatiedon tarkoituksellisestimuuttuminen hävitetäänsallitaan, pyrkien kuitenkin mahdollisimman pieneen muutokseen ihmisen saaman kokemuksen kannalta. Esimerkiksi television katselija ei todennäköisesti havaitse, jos taustalta poistetaan joitakin yksityiskohtia samallatilanteessa, kunjossa hänen katseensa kohdistuu etualalla keskusteleviin päähenkilöihinhenkilöihin. Myöskään ihmisen kuulo ei ole täydellinen; monet erilaiset ääninäytteet voivat kuulostaa samalta, vaikka ovatkin hyvin erilaisia tietokoneanalyysin mukaan. Kun löydetään sellaiset korvaavat palaset, jotka voidaan kuvata vähemmällä tietomäärällä kuin toiset, ja ne kuitenkin havainnoitsijasta tuntuvat samalta kuin alkuperäiset, voidaan saavuttaa pienempiä tiedostokokoja.
 
Periaatteessa häviöllinen pakkaus heikentää aina tallenteen laatua verrattuna alkuperäiseen. Pakattaessa siten, että laatuero ei suurinta osaa ihmisistä vielä häiritse, häviölliset menetelmät kuitenkin kykenevät yleisesti huomattavasti parempiin pakkaussuhteisiin kuin häviöttömät menetelmät.
 
Usein ihmiset kokevat häviöllisen pakkauksen miellyttävämmäksi vaihtoehdoksi kuin suuremman levytilan tai kaistanleveyden käytön. Tietyissä tapauksissa, kuten GSM-puhelimessa, äänen pakkaus mahdollistaa pienempien tiedonsiirtomäärien ansiosta matalammatmatalamman lähetystehotlähetystehon ja useampien puhelimien yhtäaikaisen käytön samalla taajuuskaistalla.
 
Häviöllistä pakkausmenetelmää ja sen asetuksia valittaessa on otettava huomioon ainakin suorituskyvyn tarve, tiivistyneen tiedon määrä ja häviöllisyyden tuntuma.