Yhdistyvä eli kombinoituva merkki on digitaalisessa typografiassa erityisenlainen kirjoitusmerkki, tyypillisesti tarke, jota käytetään jonkin toisen merkin lisukkeena. Se on teknisessä mielessä erillinen merkki, jolla on oma Unicode-tunnus, mutta se ei vie tekstirivillä lainkaan tilaa vaan asettuu edeltävän merkin – kantamerkin eli perusmerkin – kohdalle, niin että ne näyttävät muodostavan yhden kokonaisuuden. Yhdistyvä merkki voi pystysuunnassa asemoitua kantamerkin ylä- tai alapuolelle tai keskelle. Käytettävästä fontista ja ohjelmistosta riippuu, miten hyvin yhdistyvä merkki käytännössä osuu paikalleen.

Yhdistyvä lyhyysmerkki on erillinen merkki, joka asemoituu kanta­merkin päälle, niin että niistä näyttää muodos­tuvan tarkkeel­linen kirjain.

Tietokonemerkistöissä on myös teknisesti yksinkertaisempia koostemerkkejä, joihin lähtökohtaisesti sisältyvät sekä tarke että kantamerkki. Muodollisesti koostemerkki tulkitaan samaksi kuin vastaava kantamerkin ja yhdistyvän merkin muodostama kokonaisuus eli niin sanottu hajotelma. Keskenään yhtäläisiksi on siis ymmärrettävä esimerkiksi koostemerkki š (U+0161 eli latinalainen pienaakkonen s ja hattu) ja hajotelma š (U+0073 U+030C eli latinalainen pienaakkonen s, jota seuraa yhdistyvä hattu).[1]

Yhdistyvät merkit edustavat verrattain uutta fonttitekniikkaa, joka ei aina toimi ongelmitta. Jotkin ohjelmat voivat pyrkiä kiertämään mahdolliset käytännön ongelmat korvaamalla kantamerkistä ja yhdistyvästä merkistä muodostuvan hajotelman vastaavalla koostemerkillä. Kaikki yhdistelmät eivät kuitenkaan ole saatavilla koostemerkkeinä. Unicode-merkistössä ei esimerkiksi ole akuuttiaksentilla varustettuja kyrillisiä vokaalikirjaimia, joten jos venäjänkielisessä tekstissä halutaan merkitä myös sanapainot (mikä tavallisesti tehdään vain sanakirjoissa ja kielen oppikirjoissa), kyrilliseen kirjaimeen pitää liittää yhdistyvä akuutti.

Koostemerkkien ja hajotelmien vertailua muokkaa

Seuraavassa esimerkissä on sukunimi Åström kirjoitettuna ensin tavanomaisesti käyttäen koostemerkkejä Å (U+00C5) ja ö (U+00F6) ja sitten hajotelmia, joissa tarkkeetonta A-kirjainta (U+0041) seuraa yhdistyvä yläpuolinen ympyrä (U+030A) ja o-kirjainta (U+006F) yhdistyvä treema (U+0308). Eron havainnollistamiseksi kumpikin vaihtoehto on tässä lisäksi esitetty kirjain kerrallaan siten, että koostemerkit näkyvät vihreinä ja kantamerkit mustina; yhdistyvät tarkkeet voivat selaimesta ja fontista riippuen näkyä oransseina tai mustina (tai joissain selaimissa eivät ehkä lainkaan):

Åström Å s t r ö m
U+ 00C5 0073 0074 0072 00F6 006D
Åström Å s t r ö m
U+ 0041
030A
0073 0074 0072 006F
0308
006D

Värityksen eroja lukuun ottamatta nämä vaihtoehdot ovat siis periaatteessa yhtäläisiä, ja niiden pitäisi näyttää samanlaisilta. Yhdistyvät tarkkeet eivät kuitenkaan aina näy oikein, ja pahimmassa tapauksessa ne voivat jäädä piiloon[2] tai kantamerkin kohdalla tai perässä voi näkyä neliskulmainen korvikekuvio osoittamassa, että tarke ei sisälly käytössä olevaan fonttiin.

Toisaalta koostemerkitkään eivät aina ole ongelmattomia, sillä kovin eksoottiset merkit eivät sisälly kaikkiin fontteihin. Seuraavassa esimerkissä on rekonstruoituna indoeurooppalaisen kantakielen sana ’koira’:

ḱṷṓn n
U+ 1E31 1E77 1E53 006E
ḱṷṓn ḱ ṷ ṓ n
U+ 006B
0301
0075
032D
006F
0304
0301
006E

Joissain tilanteissa ensimmäisen vaihtoehdon harvinaisilla tarkkeilla varustetut k ja u sekä o (jonka yläpuolella on kaksi tarketta) voivat typografisesti näyttää silmiinpistävän erilaisilta kuin tarkkeeton n, ja pahimmassa tapauksessa niiden paikalla näkyy pelkkä neliskulmainen korvikekuvio. Yhdistyviä tarkkeita käytettäessä ainakin kantamerkkien pitäisi olla tunnistettavissa, vaikka selain ei yhdistyviä tarkkeita osaisikaan esittää oikein.

Käyttö muokkaa

Yhdistyvien merkkien kirjoittaminen vaatii usein erityistoimia. Suomalaiseen vakionäppäimistöön kuuluvat tarkenäppäimet on vanhastaan tarkoitettu koostemerkkien kirjoittamiseen, joten niillä ei suoraan voi tuottaa yhdistyviä tarkkeita.[2] Laajennetusta suomalaisesta näppäimistöasettelusta on tosin laadittu myös muunnelmia, joita käytettäessä tarkenäppäin tuottaakin yhdistyvän tarkkeen.[3] Joissain Linux-järjestelmissä (esimerkiksi Debianissa) yhdistyvän tarkkeen voi puolestaan kirjoittaa näpäyttämällä ensin erityistä yhdistelmänäppäintä (compose-näppäin, jollaiseksi usein on määritelty oikeanpuoleinen Windows-näppäin[4]) ja sen jälkeen asianmukaista tarkenäppäintä kaksi kertaa peräkkäin.

HTML-koodissa voi yhdistyvän merkin tuottaa Unicode-tunnukseen perustuvalla numeerisella merkkiviittauksella. Kun esimerkiksi yhdistyvän hatun tunnus on U+030C, voidaan käyttää vastaavaa merkkiviittausta ̌ (viittaus alkaa &-merkillä ja päättyy puolipisteeseen; tunnuksen alkunollaa ei HTML-viittaukseen tarvitse sisällyttää, mutta ristikkomerkin ja x-kirjaimen yhdistelmä #x osoittaa, että kyse on heksadesimaalisesta viittauksesta). Merkkiviittaus tulee kirjoittaa välittömästi kantamerkin perään, jotta se asettuisi edeltävän merkin kohdalle:

ř

Eräät yhdistyvät tarkkeet ovat kahden kirjaimen levyisiä, niin että ne ylettyvät myös seuraavan kirjaimen päälle. Tällöin yhdistyvä merkki kirjoitetaan siis tavallaan kahden kantamerkin väliin (tosin varsinainen kantamerkki on aina nimenomaan edeltävä merkki):[5]

t͡st͡s

Kantamerkkiin voi sekä sen ylä- että alapuolella liittyä useitakin yhdistyviä merkkejä, jolloin ne pinoutuvat (tai niiden pitäisi pinoutua) päällekkäin. Tällöin voi olla tarpeen kiinnittää huomiota siihen, missä järjestyksessä yhdistyvät merkit lisätään. Esimerkiksi suomalais-ugrilaisen tarkekirjoituksen ohjeistuksessa on linjattu, että ensin kuuluu kirjoittaa kirjaimen alapuoliset tarkkeet ja vasta niiden jälkeen yläpuoliset tarkkeet. Kummassakin tapauksessa ensin kirjoitetaan kantamerkkiä lähinnä oleva tarke ja sen jälkeen muut asteittain kantamerkistä loitontuen:[6]

ǡ͔ǡ͔

Yhdistyviä merkkejä Unicodessa muokkaa

Seuraaviin taulukoihin on koottu yhdistyviä merkkejä ilman kantamerkkiä. Ne on järjestetty Unicode-tunnusten mukaisesti. Kaikki merkit eivät välttämättä näy selaimessa oikein.

Yhdistyviä tarkkeita[7][8]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x  ̀  ́  ̂  ̃  ̄  ̅  ̆  ̇  ̈  ̉  ̊  ̋  ̌  ̍  ̎  ̏
U+031x  ̐  ̑  ̒  ̓  ̔  ̕  ̖  ̗  ̘  ̙  ̚  ̛  ̜  ̝  ̞  ̟
U+032x  ̠  ̡  ̢  ̣  ̤  ̥  ̦  ̧  ̨  ̩  ̪  ̫  ̬  ̭  ̮  ̯
U+033x  ̰  ̱  ̲  ̳  ̴  ̵  ̶  ̷  ̸  ̹  ̺  ̻  ̼  ̽  ̾  ̿
U+034x  ̀  ́  ͂  ̓  ̈́  ͅ  ͆  ͇  ͈  ͉  ͊  ͋  ͌  ͍  ͎  ͏
U+035x  ͐  ͑  ͒  ͓  ͔  ͕  ͖  ͗  ͘  ͙  ͚  ͛  ͜   ͝   ͞   ͟ 
U+036x  ͠   ͡   ͢   ͣ  ͤ  ͥ  ͦ  ͧ  ͨ  ͩ  ͪ  ͫ  ͬ  ͭ  ͮ  ͯ
  • Merkit U+0300–0333 on Unicode-standardissa luokiteltu tavanomaisiksi tarkkeiksi. Niitä voidaan käyttää monien kielten oikeinkirjoituksessa ja tieteellisessä tarkekirjoituksessa.
  • U+0334–0338 asemoituvat kantamerkin keskelle.
  • U+0339–033F ovat tarkemmin luokittelemattomia lisäyksiä.
  • U+0340 ja U+0341 ovat vietnamin vanhentuneita toonimerkkejä, joiden sijasta olisi käytettävä gravista ja akuuttia (U+0300 ja U+0301).
  • U+0342–0345 ovat lisäyksiä erityisesti kreikan kirjoittamista varten – tosin U+0343 on määritelty yhtäläiseksi yläpuolisen pilkun (U+0313) kanssa, ja merkin U+0344 sijasta suositellaan treeman (U+0308) ja akuutin (U+0301) yhdistelmää.
  • U+0346–034A ovat lisäyksiä kansainvälistä tarkekirjoitusta varten.
  • U+034B–034E ovat kansainvälisen tarkekirjoituksen lisäyksiä, joilla voidaan merkitä epäselvää puhetta.
  • U+034F on näkymätön. Englanninkielinen nimi grapheme joiner on harhaanjohtava, sillä merkki ei liitä kirjoitusmerkkejä yhteen.
  • U+0350–0357 ovat lisäyksiä suomalais-ugrilaista tarkekirjoitusta varten.
  • U+0358–035B ovat sekalaisia lisäyksiä.
  • U+035C–0362 ovat kahden kirjaimen levyisiä tarkkeita.
  • U+0363–036F ovat historiallisia, lähinnä keskiaikaisissa germaanisissa käsikirjoituksissa käytettyjä kirjaintarkkeita.[8]

Jos yhdistyviä ylä- tai alaviivamerkkejä (U+0305, U+0332, U+0333, U+033F) liitetään peräkkäisiin kantamerkkeihin, niistä pitäisi periaatteessa muodostua yhtenäinen ylle- tai alleviivaus, mutta tähän tarkoitukseen on suositeltavaa käyttää tavanomaisempia tyylitekniikoita.[5]

Täydennyksiä yhdistyviin tarkkeisiin[9]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx  ᷀  ᷁  ᷂  ᷃  ᷄  ᷅  ᷆  ᷇  ᷈  ᷉  ᷊  ᷋  ᷌  ᷍   ᷎  ᷏
U+1DDx  ᷐  ᷑  ᷒  ᷓ  ᷔ  ᷕ  ᷖ  ᷗ  ᷘ  ᷙ  ᷚ  ᷛ  ᷜ  ᷝ  ᷞ  ᷟ
U+1DEx  ᷠ  ᷡ  ᷢ  ᷣ  ᷤ  ᷥ  ᷦ                  
U+1DFx                          ᷼   ᷽  ᷾  ᷿
  • U+1DC0–1DC1 ovat muinaiskreikkalaisten käsikirjoitusten korjauslukumerkkejä.
  • U+1DC2–1DC3 sekä U+1DCA ja U+1DFD ovat sekalaisia täydennyksiä.
  • U+1DC4–1DC9 ja U+1DCB–1DCC ovat tavanomaisten tarkkeiden yhteensulautumia, joilla merkitään muuntuvaa toonia.
  • U+1DCD on kahden kirjaimen levyinen sirkumfleksi.
  • U+1DCE–1DD2 ovat keskiajan tutkimukseen liittyviä tarkkeita.
  • U+1DD3–1DE6 ovat keskiaikaisia kirjaintarkkeita.
  • U+1DFC on kahden kirjaimen levyinen alapuolinen ylösalainen lyhyysmerkki suomalais-ugrilaista tarkekirjoitusta varten.
  • U+1DFE–1DFF ovat suomalais-ugrilaista tarkekirjoitusta varten lisättyjä nuolenpäätarkkeita.[9]

Harmaat merkkipaikat eivät toistaiseksi ole käytössä.

Yhdistyviä tarkkeita symboleille[10]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx  ⃐  ⃑  ⃒  ⃓  ⃔  ⃕  ⃖  ⃗  ⃘  ⃙  ⃚  ⃛  ⃜  ⃝  ⃞  ⃟
U+20Ex  ⃠  ⃡  ⃢  ⃣  ⃤  ⃥  ⃦  ⃧  ⃨  ⃩  ⃪  ⃫  ⃬  ⃭  ⃮  ⃯
U+20Fx  ⃰                              
  • U+20DD–20E0 sekä U+20E2–20E4 asemoituvat kantamerkin ympärille ikään kuin kehyksiksi.
Yhdistyviä puolikasmerkkejä[11]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x  ︠  ︡  ︢  ︣  ︤  ︥  ︦                  

Katso myös muokkaa

Lähteet muokkaa

  1. Jukka K. Korpela: Kirjainten tarinoita (PDF) (luku 4.1, ”Tarkennusta tarkkeen käsitteeseen”, s. 132–133) jkorpela.fi. 14.1.2011. Viitattu 8.4.2014.
  2. a b Jukka Korpela: Merkkien kirjoittaminen tietokoneella (osio ”Tarkkeiden kirjoittaminen”) Nykyajan kielenopas. 19.3.2014. Viitattu 9.4.2014.
  3. Jukka Korpela: Suomalainen monikielinen näppäimistö jkorpela.fi. 18.8.2006, päivitetty 19.12.2013. Viitattu 9.4.2014.
  4. Shaun McCance ym.: Erikoismerkkien käyttäminen Gnome Help. 2005‒2014. Viitattu 9.4.2014.
  5. a b Julie D. Allen ym. (toim.): European Alphabetic Scripts (PDF) (luku 7.9, ”Combining Marks”, s. 238–244) The Unicode Standard, Version 6.1 – Core Specification. 2012. Mountain View, CA: Unicode Consortium. Viitattu 10.4.2014.
  6. Kotus: Universaalimerkistö suomalais-ugrilaisessa tarkekirjoituksessa kotus.fi. 2009. Arkistoitu 13.4.2014.
  7. Jukka Korpela: Tarkkeiden nimet jkorpela.fi. 10.3.2005, päivitetty 12.1.2012. Viitattu 9.4.2014.
  8. a b Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  9. a b Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  10. Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  11. Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.