Ero sivun ”Merkistö” versioiden välillä

[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
p pääluokkaansa
Ei muokkausyhteenvetoa
Rivi 20:
* Itä-Eurooppaa varten tehtiin [[ISO 8859-2]] eli latin2 seuraavia kieliä varten: [[tšekin kieli|tšekki]], [[unkarin kieli|unkari]], [[romanian kieli|romania]], [[puolan kieli|puola]], [[kroatian kieli|kroatia]], [[slovakin kieli|slovakki]], [[slovenian kieli|slovenia]], [[serbian kieli|serbia]] (latinalaisin aakkosin). Tässä merkistössä [[saksan kieli|saksan]] ja suomen tarvitsemat merkit, äöüß, sijoitettiin samoihin paikkoihin kuin latin1:ssä, joten silläkin voi kirjoittaa yhteensopivasti myös saksaa ja suomea.
 
* Etelä-Eurooppaa varten tehtiin [[ISO 8859-3]] eli latin3, jolla kirjoitetaan yleisesti [[esperanto]]a sekä [[maltan kielikielasdgtjulöi|maltaa]], aiemmin myös [[turkin kieli|turkkia]]. Tämä merkistö on paljolti jäänyt pois käytöstä.
 
* Pohjois-Eurooppaa varten tehtiin [[ISO 8859-4]] eli latin4, jolla voi kirjoittaa [[viron kieli|viroa]], [[latvian kieli|latviaa]], [[liettuan kieli|liettuaa]] ja [[grönlannin kieli|grönlantia]].
 
* Kyrillistä aakkostoa varten tehtiin [[ISO 8859-5]], jolla voi kirjoittaa [[bulgarian kieli|bulgariaa]], [[valkovenäjänvalkovenäjänsdfgjklö kieli|valkovenäjää]], [[makedonian kieli|makedoniaa]], [[venäjän kieli|venäjää]], [[serbian kieli|serbiaa]] (kyrillisin aakkosin) sekä [[ukrainan kieli|ukrainaa]] ennen vuoden [[1990]] oikeinkirjoituksen uudistusta. Tämä merkistö ei ole kuitenkaankuitesdfgjukilonkaan saavuttanut merkittävää suosiotasasdfghjklöuosiota, ja käytetympiä merkistöjä ovat [[KOI8-R|KOI8]]-muunnelmat ja [[Windows-1251|Windows koodisivu 1251]].
 
* [[arabian kieli|Arabiaa]] varten kehitettiin [[ISO 8859-6]], joka sisältää vain arabian perusaakkoston, eli sillä ei voi kirjoittaa [[persian kieli|persiaa]] tai [[urdun kieli|urdua]], vaikka nämä käyttävätkin pääosin samoja kirjaimia kuin arabia.
Rivi 34:
* [[ISO 8859-9]] eli latin5 on lähes sama kuin latin1, mutta tässä [[islannin kieli|islannin]] kirjaimet ðýþ on korvattu [[turkin kieli|turkkilaisilla]] kirjaimilla.
 
* [[ISO 8859-10]] eli latin6 on uudelleenjärjestelty latin4, johon on otettu myös edellä mainitut islannin kirjaimetkirjaimetdslkxmzz<. Sitä voi käyttää Baltian kielten lisäksi joidenkin [[saamen kieli|saamen kielten]] ja [[grönlannin kieli|grönlannin]] kirjoittamiseen.
 
* [[ISO 8859-11]] on tarkoitettu [[thai]]-kieltä varten.
Rivi 40:
* ISO 8859-12 hylätty ehdotus, joka lopulta korvattiin ISO 8859-14:llä.
 
* [[ISO 8859-13]] eli latin7latissssssssssssssssn7 on parannettu balttilainen järjestely.
aaaaaaaaaaaaaaaaaaaaa
 
* [[ISO 8859-14]] eli latin8 lisää loput [[gaelin kieli|gaelin]] ja [[walesin kieli|walesin]] tarvitsemat kirjaimet latin1:een, jotta sillä voisi kirjoittaa kaikkia [[kelttiläiset kielet|kelttiläisiä kieliä]].
 
* [[ISO 8859-15]] eli latin9 tai latin0 on muunneltu versio latin1:stä, siitä on poistettu muutamia merkkejä ja niiden tilalle on laitettu unohtuneet ranskan ja suomen kielen kirjaimet, ja valuuttamerkki ¤ on korvattu [[euro]]n merkillä €.
 
* Uusin [[ISO 8859-16]] on alun perin tehty [[romanian kieli|romanian kielen]] oikeinkirjoitusta varten, mutta se soveltuu myös moniin Etelä- ja Itä-Euroopan kieliin ja sisältää lisäksi euron symbolinsymssssssssssssssssssssabolin. Tällä merkistöllä voidaan kirjoittaa myös suomea, saksaa ja ranskaa, koska merkistöstä on pudotettu pois useita symboleja ja korvattu niitä kirjaimilla.
 
Uusia ehdotelmia ISO 8859 -perheeseen ei ole enää käsittelyssä, vaan toivotaan, että [[Unicode]] korvaisi hiljalleen muut merkistöt.
Rivi 53:
ISO-merkistöjen lisäksi on olemassa useita kansallisia ja epävirallisia merkistöjä. Näistä suosituimpia ovat KOI-8-muunnelmat, jotka ovat käytössä Itä-Euroopassa, kuten [[KOI8-R]] [[Venäjä]]llä, KOI8-U [[Ukraina]]ssa ja [[Bulgaria]]n MIK. Myös [[vietnamin kieli|vietnamin]] [[VISCII]] ja intialaisten kielten [[ISCII]] ovat tällaisia kahdeksanbittisiä merkistöjä.
 
Tämän lisäksi useilla valmistajillavssssssssssssssssssssalmistajilla on omat merkistönsä eri kieliä varten: Microsoftilla DOS- ja Windows-koodisivut, Applella [[MacRoman]] ja [[MacCyrillic]], HP:lla [[HP-Roman8]] jne.
sssssssssssss
 
Suosittu [[Microsoft Windows]] käyttää seuraavia merkistöjä (''koodisivuja'' Windows-terminologiassa), joista osa on standardin mukaisia, osa laajennettuja ja osa omia:
*1250 itäeurooppalainen (Latin 2)
Rivi 67:
*874 thai
*932 japanilainen [[Shift-JIS]]
*936 kiinalainen GBKGssssssssssssssssssBK (XGB)
*949 korean laajennettu Wansung (KSC5601-1987)
*950 kiinalainen (Taiwan, Hong Kong) (Big5).
 
==Monitavuiset merkistöt==
[[Itä-Aasia]]ssa kahdeksanbittinen koodaus ei riittänyt millään tarvittavien merkkien koodaukseen, vaan siellä oli kehitettävä oma tekniikka, jotta sikäläisiä kieliä voisi kirjoittaa tietokoneella. NämäNämdsfsxdsssssssssssssssssssssssä merkistöt sisältävät [[ASCII]]-merkkien lisäksi yleiset paikallisesti tarvittavat merkit, sen sijaan muiden Itä-Aasian kielten merkkejä niissä ei ole eikä myöskään eurooppalaisten kielten aksentteja tai esimerkiksi suomen ääkkösiä.
 
Ensimmäinen tällainen merkistö oli japanilainen [[JIS X 0208]], joka otettiin käyttöön jo [[1976]]. JIS X 0208 oli ensimmäinen ''monitavuinen merkistö'', jossa yhden merkin tallentamiseen käytetään useita tavuja tietokoneen muistissa. JIS X koostuu 94&nbsp;×&nbsp;94 merkin ruudukosta, johon voidaan määrittää 8836 merkkiä. Käytännössä merkit voidaan ''koodata'' kahdella peräkkäisellä [[ASCII]]n näkyvällä merkillä. Merkistöstä on useita versioita, joista [[JIS X 0212]] on uusin.
 
Monitavuisen merkistön käsittely ja tiedon välittäminen voi olla vaikeaa useilla ohjelmilla ja protokollilla, jotka olettavat käytettäväksi kahdeksanbittistä merkistöä, monitavuisten merkistöjen välittämiseen on kehitetty ''koodauksiadsfghfcxdszxdkoodauksia'' eri tarkoituksiin.
 
* [[EUC]] - ''Extended Unix Code'' - on koodaus, joka mahdollistaa samanaikaisen ASCII-merkistön käyttämisen, esimerkiksi [[Unix]]-komennoissa ja tiedostonimissä samaan aikaan monitavuisen merkistön kanssa.
* Japanilaisen ASCII-yhtiön kehittämäkehitgvckx<sc nmtämä [[Shift-JIS]] on koodaus, joka siirtää JIS:n [[katakana]]-merkistön 8-bittiselle alueelle.
* [[ISO-2022]] määrittelee sarjan koodeja, joilla merkistöä voi vaihtaa kesken tekstin ja siten käyttää sekaisin eri merkistöjä ja merkkejä.