Ero sivun ”Koostemerkki” versioiden välillä

[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
p Luokka:Kirjoitus → Tarkkeet
palautetaanpa äsken poistettu lähde ja ohjataan arkistoversioon, koska siinä on tietoa kantamerkistä tiedonhaussa
Rivi 1:
'''Koostemerkki''' tarkoittaa erityisesti [[Unicode]]-termistössä [[kirjoitusmerkki]]ä, joka voidaan määritellä kahden tai useamman merkin yhdistelmäksi. Tyypillisesti koostemerkki on [[Tarke|tarkkeella]] varustettu [[kirjain]], kuten [[š]] (U+0161 eli [[Latinalainen kirjaimisto|latinalainen]] pienaakkonen  [[s]] ja [[Hattu (tarke)|hattu]]), joka voidaan teknisesti hajottaa kantamerkiksi s (U+0073) ja [[Yhdistyvä merkki|yhdistyväksi]] hatuksi (U+030C). Tällainen niin sanottu hajotelma on ymmärrettävä yhtäläiseksi vastaavan koostemerkin kanssa.<ref name="Korpela 2011"/><ref name="Unicode 2009"/>
 
Vanhastaan tietokoneet ovat käsitelleet tarkkeellisia kirjaimia nimenomaan koostemerkkeinä. Vaikka Unicode on mahdollistanut myös hajotelmien käytön ja periaatteessa suosiikin niitä, jotkin ohjelmat voivat pyrkiä korvaamaan hajotelmat koostemerkeillä, joiden käsittely on teknisesti yksinkertaisempaa. Kaikki yhdistelmät eivät kuitenkaan ole saatavilla koostemerkkeinä.
 
Toisaalta kirjaintenkantamerkin irrottaminen koostemerkistä helpottaa esimerkiksi tietokoneavusteista [[Aakkosjärjestystiedonhaku]]a, kun vaikkapa [[Turkin kieli|aakkostuksenturkkilaista]] yksinkertaistamiseksinimeä jotkin[[Recep ohjelmatTayyip voivatErdoğan|Erdoğan]] hajottaavoi koostemerkithakea kantamerkiksipelkistetysti jamuodossa yhdistyväksi”Erdogan” tarkkeeksitarvitsematta miettiä, miten saisi suomalaisella näppäimistöllä [[g]]-kirjaimeen lisätyksi [[Lyhyysmerkki|lyhyysmerkin]].<ref name="Weiss 2001"/> Vastaavasti [[Aakkosjärjestys|aakkostus]] tapahtuu usein ensisijaisesti kantamerkin perusteella,<ref name="Microsoft 2010"/> Tällöinjoskin ontällöin tosinon otettava huomioon kielikohtaiset erot. Esimerkiksi suomalaisiin aakkosiin kuuluvat koostemerkit [[å]], [[ä]] ja [[ö]] itsenäisinä kirjaimina, mutta [[Englannin kieli|englantilaisittain]] ne tulkitaan vain tarkkeellisiksi muunnelmiksi, jotka aakkostuvat samalla tavalla kuin kantamerkki [[a]] tai [[o]]. Koostemerkki š puolestaan aakkostuu suomalaisittainkin samalla tavalla kuin kantamerkki s, mutta [[Viron kieli|virolaisittain]] erikseen tarkkeettoman s:n jälkeen.
 
== Katso myös ==
Rivi 17:
 
<ref name="Unicode 2009">{{Verkkoviite | Osoite = http://www.unicode.org/versions/Unicode5.2.0/ch03.pdf | Nimeke = Conformance | Tekijä = Unicode | Tiedostomuoto = PDF | Selite = luku 3.7, ”Decomposition”, s. 85 | Julkaisu = The Unicode Standard 5.2 | Ajankohta = 1991–2009 | Julkaisupaikka = | Julkaisija = | Viitattu = 8.4.2014 | Kieli = }}</ref>
 
<ref name="Weiss 2001">{{Verkkoviite | Osoite = http://web.archive.org/web/20111108105615/http://www.wdvl.com/Authoring/Unicode/composite.html | Nimeke = Composite and Precomposed Characters | Tekijä = Aaron Weiss | Tiedostomuoto = | Selite = [[Internet Archive]]en 8.11.2011 arkistoitunut versio | Julkaisu = | Ajankohta = 20.2.2001 | Julkaisupaikka = | Julkaisija = Web Developer’s Virtual Library | Viitattu = 12.9.2010 | Kieli = }}</ref>
 
}}