Ero sivun ”Merkistö” versioiden välillä
[arvioimaton versio] | [arvioimaton versio] |
Poistettu sisältö Lisätty sisältö
PtG (keskustelu | muokkaukset) p pääluokkaansa |
Ei muokkausyhteenvetoa |
||
Rivi 20:
* Itä-Eurooppaa varten tehtiin [[ISO 8859-2]] eli latin2 seuraavia kieliä varten: [[tšekin kieli|tšekki]], [[unkarin kieli|unkari]], [[romanian kieli|romania]], [[puolan kieli|puola]], [[kroatian kieli|kroatia]], [[slovakin kieli|slovakki]], [[slovenian kieli|slovenia]], [[serbian kieli|serbia]] (latinalaisin aakkosin). Tässä merkistössä [[saksan kieli|saksan]] ja suomen tarvitsemat merkit, äöüß, sijoitettiin samoihin paikkoihin kuin latin1:ssä, joten silläkin voi kirjoittaa yhteensopivasti myös saksaa ja suomea.
* Etelä-Eurooppaa varten tehtiin [[ISO 8859-3]] eli latin3, jolla kirjoitetaan yleisesti [[esperanto]]a sekä [[maltan
* Pohjois-Eurooppaa varten tehtiin [[ISO 8859-4]] eli latin4, jolla voi kirjoittaa [[viron kieli|viroa]], [[latvian kieli|latviaa]], [[liettuan kieli|liettuaa]] ja [[grönlannin kieli|grönlantia]].
* Kyrillistä aakkostoa varten tehtiin [[ISO 8859-5]], jolla voi kirjoittaa [[bulgarian kieli|bulgariaa]], [[
* [[arabian kieli|Arabiaa]] varten kehitettiin [[ISO 8859-6]], joka sisältää vain arabian perusaakkoston, eli sillä ei voi kirjoittaa [[persian kieli|persiaa]] tai [[urdun kieli|urdua]], vaikka nämä käyttävätkin pääosin samoja kirjaimia kuin arabia.
Rivi 34:
* [[ISO 8859-9]] eli latin5 on lähes sama kuin latin1, mutta tässä [[islannin kieli|islannin]] kirjaimet ðýþ on korvattu [[turkin kieli|turkkilaisilla]] kirjaimilla.
* [[ISO 8859-10]] eli latin6 on uudelleenjärjestelty latin4, johon on otettu myös edellä mainitut islannin
* [[ISO 8859-11]] on tarkoitettu [[thai]]-kieltä varten.
Rivi 40:
* ISO 8859-12 hylätty ehdotus, joka lopulta korvattiin ISO 8859-14:llä.
* [[ISO 8859-13]] eli
aaaaaaaaaaaaaaaaaaaaa
* [[ISO 8859-14]] eli latin8 lisää loput [[gaelin kieli|gaelin]] ja [[walesin kieli|walesin]] tarvitsemat kirjaimet latin1:een, jotta sillä voisi kirjoittaa kaikkia [[kelttiläiset kielet|kelttiläisiä kieliä]].
* [[ISO 8859-15]] eli latin9 tai latin0 on muunneltu versio latin1:stä, siitä on poistettu muutamia merkkejä ja niiden tilalle on laitettu unohtuneet ranskan ja suomen kielen kirjaimet, ja valuuttamerkki ¤ on korvattu [[euro]]n merkillä €.
* Uusin [[ISO 8859-16]] on alun perin tehty [[romanian kieli|romanian kielen]] oikeinkirjoitusta varten, mutta se soveltuu myös moniin Etelä- ja Itä-Euroopan kieliin ja sisältää lisäksi euron
Uusia ehdotelmia ISO 8859 -perheeseen ei ole enää käsittelyssä, vaan toivotaan, että [[Unicode]] korvaisi hiljalleen muut merkistöt.
Rivi 53:
ISO-merkistöjen lisäksi on olemassa useita kansallisia ja epävirallisia merkistöjä. Näistä suosituimpia ovat KOI-8-muunnelmat, jotka ovat käytössä Itä-Euroopassa, kuten [[KOI8-R]] [[Venäjä]]llä, KOI8-U [[Ukraina]]ssa ja [[Bulgaria]]n MIK. Myös [[vietnamin kieli|vietnamin]] [[VISCII]] ja intialaisten kielten [[ISCII]] ovat tällaisia kahdeksanbittisiä merkistöjä.
Tämän lisäksi useilla
sssssssssssss
Suosittu [[Microsoft Windows]] käyttää seuraavia merkistöjä (''koodisivuja'' Windows-terminologiassa), joista osa on standardin mukaisia, osa laajennettuja ja osa omia:
*1250 itäeurooppalainen (Latin 2)
Rivi 67:
*874 thai
*932 japanilainen [[Shift-JIS]]
*936 kiinalainen
*949 korean laajennettu Wansung (KSC5601-1987)
*950 kiinalainen (Taiwan, Hong Kong) (Big5).
==Monitavuiset merkistöt==
[[Itä-Aasia]]ssa kahdeksanbittinen koodaus ei riittänyt millään tarvittavien merkkien koodaukseen, vaan siellä oli kehitettävä oma tekniikka, jotta sikäläisiä kieliä voisi kirjoittaa tietokoneella.
Ensimmäinen tällainen merkistö oli japanilainen [[JIS X 0208]], joka otettiin käyttöön jo [[1976]]. JIS X 0208 oli ensimmäinen ''monitavuinen merkistö'', jossa yhden merkin tallentamiseen käytetään useita tavuja tietokoneen muistissa. JIS X koostuu 94 × 94 merkin ruudukosta, johon voidaan määrittää 8836 merkkiä. Käytännössä merkit voidaan ''koodata'' kahdella peräkkäisellä [[ASCII]]n näkyvällä merkillä. Merkistöstä on useita versioita, joista [[JIS X 0212]] on uusin.
Monitavuisen merkistön käsittely ja tiedon välittäminen voi olla vaikeaa useilla ohjelmilla ja protokollilla, jotka olettavat käytettäväksi kahdeksanbittistä merkistöä, monitavuisten merkistöjen välittämiseen on kehitetty ''
* [[EUC]] - ''Extended Unix Code'' - on koodaus, joka mahdollistaa samanaikaisen ASCII-merkistön käyttämisen, esimerkiksi [[Unix]]-komennoissa ja tiedostonimissä samaan aikaan monitavuisen merkistön kanssa.
* Japanilaisen ASCII-yhtiön
* [[ISO-2022]] määrittelee sarjan koodeja, joilla merkistöä voi vaihtaa kesken tekstin ja siten käyttää sekaisin eri merkistöjä ja merkkejä.
|