Forstå Unicode tegn

October 3  by Eliza

Du har kanskje hørt om begrepet Unicode før, og lurte på hva det betydde. Normale Énbytestegn ordninger (for eksempel ASCII og ANSI) tillater bare opp til 256 unike individuelle tegn som skal kodes og vises på datamaskinen. I den globale datasamfunnet, der hvert medlem er nødvendig for å jobbe på sitt eget språk, er dette et problem. Det er langt mer enn 256 tegn i vanlig bruk over hele verden.

Det er der Unicode kommer inn i bildet. Unicode-standarden krever tildeling av to bytes (seksten biter) for koding av hvert tegn. Dette betyr at det kan være 65.536 unike figurer definert. Denne standarden, utviklet og markedsført av Unicode Consortium (http://www.unicode.org), åpner for visning av praktisk talt alle de unike språktegn i verden. Et team av datamaskinen fagfolk, lingvister, og forskere jobbet med den faktiske utviklingen av Unicode.

Bruken av to byte å definere hvert tegn betyr at Unicode kan brukes til å kode de fleste av de tegnene som brukes i verdens store språk. Det er en forlengelse mekanisme innebygget i standarden, så vel, som betyr at det er mulig å kode nær en million flere tegn, hvis det er nødvendig. Denne muligheten bør være tilstrekkelig for alle kjente språkkrav, pluss koding av alle de historiske manuskripter av verden. (Dette inkluderer språk og symboler som ikke lenger er i bruk.)

Som for tiden definert, Unicode 6.1 (den nyeste versjonen) inneholder koder for tegn som brukes i de store skriftspråkene i verden, blant annet arabisk, armensk, balinesisk, bengalsk, bopomofo, Buhid, kanadiske Syllabics, Cherokee, kinesisk, kyrillisk, Deseret, Devanagari , etiopisk, georgisk, gotisk, gresk, Gujarati, gurmukhi, Han, hangul, Hanunoo, hebraisk, hiragana, Kannada, Katakana, Khmer, Lao, latin, malayalam, mongolsk, Myanmar, ogham, Gammelitalisk (etruskiske), Oriya, fønikisk , Rune, singalesisk, syrisk, tagalog, tagbanwa, tamil, telugu, Thaana, thai, tibetansk, og Yi. Arbeidet går for å legge til flere karakterer fra mindre kjente språk.

I tillegg inneholder Unicode også mange forskjellige symboler, inkludert tall, generelle diakritiske tegn, generell tegnsetting, generelle symboler, dingbats, piler, blokker, bokstegne former, geometriske figurer, matematiske symboler, musikalske symboler (vestlige og bysantinske), tekniske symboler, braille mønstre, og Kangxi radikaler.

Unicode støttes i alle moderne versjoner av Windows og Word.

WordTips er din kilde for kostnadseffektiv Microsoft Word trening. (Microsoft Word er den mest populære tekstbehandlingsprogrammet i verden.) Dette tipset (1788) gjelder for Microsoft Word 97, 2000, 2002, og 2003. Du kan finne en versjon av dette tipset for Båndet av Word (Word 2007 og senere) her: Forstå Unicode tegn.