kódrendszerek
ASCII vagy US-ASCII kódtábla (American Standard Code
for Information Interchange, ANSI X3.4-1986; az ISO-7 (ISO 646-1973) hétbites
nemzetközi kódszabvány amerikai (US) változata;
az IBM PC-k megjelenésével ennek nyolcbites kiterjesztése
terjedt el, amelyre példa az MS-DOS 437-es kódtáblája)
-
vezérlõ karakterek (#0..#31 és
#127)
-
sorvége jel (szöveges fájlok esetén az Enter
billentyû lenyomásával "írható be" az
állományba és ugyanúgy törölhetõ,
mint a többi, megjeleníthetõ karakter)
-
DOS: CR (Carriage Return: #13) + LF (Line Feed: #10)
-
UNIX: csak LF (Line Feed: #10)
-
módosító billentyûkkel
bevihetõ vezérlõ karakterek
-
megjeleníthetõ karakterek
(#32..#126); néhány fontosabb karakter kódja, amit
érdemes megjegyezni:
-
szóköz vagy space (#32)
-
" (quotation mark, dupla idézõjel; #34)
-
& (ampersand; #38)
-
' (aposztróf; #39)
-
* (#42)
-
0 (#48), ..., 9 (#57)
-
@ (At karakter, "kukac"; #64)
-
A (#65), ..., Z (#90)
-
\ (backslash, "visszaper"; #92)
-
a (#97), ..., z (#122)
-
az ASCII kódtábla nyolcbites kiterjesztésében
szereplõ karakterek (#128..#255); néhány fontosabb
karakter kódja, amit érdemes megjegyezni (pl. a DOS 437-es
kódtáblából):
-
é (#130), ä (#132), á (#160)
fontosabb vezérlõ karakterek
-
NUL (null karakter) (#0)
-
SOH (start of header, fejléc kezdete) (#1)
-
STX (start of text, szöveg kezdete) (#2)
-
ETX (end of text, szöveg vége) (#3)
-
EOT (end of transmission, átvitel vége) (#4)
-
ENQ (enquiry, érdeklõdés: kész-e a címzett
adat küldésére vagy fogadására?) (#5)
-
ACK (acknowledge, pozitív megerõsítés: a korábbi
üzenetek rendben megérkeztek) (#6)
-
BEL (bell, hangjelzés) (#7)
-
BS (backspace, törlés a kurzor pozíciójától
balra; Backspace billentyû kódja) (#8)
-
HT (horizontal tabulation, vízszintes tabulátor; Tab billentyû
kódja) (#9)
-
LF (line feed, soremelés: kurzor átvitele a következõ
sorba; Ctrl Enter billentyû kódja) (#10)
-
VT (vertical tabulation, függõleges tabulátor) (#11)
-
FF (form feed, lapdobás; nyomtatók esetén az aktuális
lap nyomtatásának befejezése) (#12)
-
CR (carriage return, kocsivissza: kurzor pozicionálása
a sor elejére; ENTER billentyû kódja) (#13)
-
SO (shift out, "nagybetûre" váltás kikapcsolása:
az adatfolyamban következõ karakter(ek) értelmezésének
visszaállítása normál módra) (#14)
-
SI (shift in, "nagybetûre" váltás bekapcsolása:
az adatfolyamban következõ karakter(ek) értelmezésének
megváltoztatása) (#15)
-
DLE (data link escape, a soron következõ karakter értelmezésének
megváltoztatása; v.ö. ESC) (#16)
-
...
-
NAK (negative acknowledge, negatív megerõsítés:
a korábbi üzenetek nem érkeztek meg rendben,
újra kell küldeni õket) (#21)
-
SYN (sync caharacter, szinkronizáló karakter: az üzenetek
elõtt küldött karakter(ek) a küldõ és
fogadó eszközök órajelének szinkronizálása
céljából) (#22)
-
ETB (end of transmission block, az átviteli blokk vége) (#23)
-
CAN (cancel, érvénytelenítés: a megelõzõ
karakter(ek) figyelmen kívül hagyása) (#24)
-
...
-
SUB (substitute, helyettesítés; DOS szöveges fájlok
esetén ez a fájlvége, EOF (End Of File) karakter)
(#26)
-
ESC (escape, a soron következõ karakter értelmezésének
megváltoztatása; ESC billentyû kódja) (#27)
-
...
-
DEL (delete, törlés; a következõ karakter vagy
adatblokk figyelmen kívül hagyása) (#127)
módosító billentyûkkel bevihetõ
vezérlõ karakterek (egyes esetekben a vezérlõ
karakterek is megjeleníthetõ karakterekként viselkednek,
pl. Ctrl Z (#26) hatására egy jobbra mutató nyíl
jelenik meg)
-
Ctrl A (#1), ..., Ctrl Z (#26)
-
Ctrl C karakterrel tudjuk a DOS vagy UNIX programok futását
(általában) megszakítani
-
Ctrl D karakterrel tudjuk UNIX rendszerben befejezni a karakterek
beírását a billentyûzetrõl egy szöveges
állományba
-
Ctrl Z karakterrel tudjuk DOS rendszerben befejezni
a karakterek beírását a billentyûzetrõl
egy szöveges állományba
-
Crrl [ vagy Ctrl õ (#27), Ctrl \ vagy Ctrl û
(#28), Ctrl ] vagy Ctrl ú (#29), Ctrl 6 (#30), Ctrl - vagy Ctrl
ü (#31)
-
Ctrl BS (#127)
az ASCII kódrendszer 8 bites kiterjesztései (az eredetileg
7 bites, azaz 128 karakterkódot tartalmazó ASCII kódrenszert
az ISO 8859-es nemzetközi szabványsorozat további 128
karakterrel bõvíti ki)
-
nyugat-európai kódrendszerek
-
ISO 8859-1: West Europe (Latin-1) /*Java kód:
8859_1*/
-
DOS 850 (PC Latin-1) /*Java kód: Cp850*/
-
Windows-1252: West Europe / Latin-1 /*Java kód: Cp1252*/
-
közép vagy kelet-európai kódrendszerek
-
ISO 8859-2: Central / Eastern Europe (Latin-2) /*Java
kód: 8859_2*/
-
megfelelõ kódtábla: Windows 28592
-
megjegyzés: a Windows magyar változata "természetesen"
más kódrendszert használ (Windows 1250); ezenkívül
korábban más kódrendszereket is használtak
(pl. a CWI kódrendszert), nem beszélve a kényszer
szülte megoldásokról, mint pl. a szellemes, de kissé
ijesztõ "repülõ" ékezetes karakterekrõl,
amelyek leginkább az elektronikus levelezésben terjedtek
el (például a', o", u:, stb.)
-
DOS 852 (PC Latin-2) /*Java kód: Cp852*/
-
Windows-1250: Central Europe / Latin-2 /*Java kód: Cp1250*/
-
egyéb (szabványos) kódrendszerek (itt már csak
az ISO 8859-es szabványsorozatra szorítkozva; a Java nyelvben
több, mint száz kódszabvány van felsorolva...)
-
ISO 8859-3: (Latin-3)
-
ISO 8859-4: (Latin-4)
-
ISO 8859-5: Cyrillic, cirill
-
ISO 8859-6: Arabic, arab
-
ISO 8859-7: Greek, görög
-
ISO 8859-8: Hebrew, héber
-
ISO 8859-9: Turkish, török (Latin-5)
-
ISO 8859-10: Samian (nincs szabványos nyelvkódja(!), de a
különbözõ dialektusait több országban,
így pl. Norvégiában sokan beszélik) (Latin-6)
fontosabb kiterjesztett karakterkódok (a Turbo
Pascal-ban a #0 karakterkód beolvasása a Crt unit
Readkey
standard függvényével azt jelzi, hogy
egy második
1 bájtos karakterkód következik)
-
Shift TAB (#15)
-
funkcióbillentyûk
-
F1 (#59), ..., F10 (#68)
-
Shift F1 (#84), ..., Shift F10 (#93)
-
Ctrl F1 (#94), ..., Ctrl F10 (#103)
-
Alt F1 (#104), ..., Alt F10 (#113)
-
kurzormozgató billentyûk
-
fel (#72), balra (#75), jobbra (#77), le (#80)
-
kiemelt vezérlõbillentyûk
-
Home (#71), Ctrl Home (#119)
-
PageUp (#73), Ctrl PageUp (#132)
-
End (#79), Ctrl End (#117)
-
PageDown (#81), Ctrl PageDown (#118)
-
Insert (#82)
-
Delete (#83)
-
a billentyûzet "normál"
karaktereinek kiterjesztett kódjai
a billentyûzet "normál" karaktereinek kiterjesztett
kódjai
-
elsõ (felsõ) billentyûsor
-
Alt 1 (#120), ..., Alt 9 (#128), Alt 0 vagy Alt ö (#129),
Alt - vagy Alt ü (#130), Alt = vagy Alt ó (#131)
-
második billentyûsor
-
Alt Q (#16), ..., Alt P (#25)
-
harmadik billentyûsor
-
Alt A (#30), ..., Alt L (#38)
-
negyedik (alsó) billentyûsor
-
Alt Z vagy Alt Y (#44), Alt X (#45), ..., Alt M (#50)
az Unicode kódrendszer (az Unicode egy "univerzális"
16 bites kódrendszer, amely felülrõl kompatibilis a
7 bites ASCII kódrendszerrel; a világ összes nyelvének
karakterkészletét tartalmazza, de egyes "holt" nyelvek ábécéje
is megtalálható benne, pl. a szanszkrit nyelvé)
-
\u0020..\007e (a hexadecimálisan megadott 0020 és 007e
közötti kódokhoz rendelt Unicode karakterek megegyeznek
az ASCII kódtábla 32..126 kódú elemeivel)
-
magyar ékezetes kisbetûk és gyakori helyettesítõik
-
\u00e1 (a'), \u00e9 (e'), \u00ed (i')
-
\u00f3 (o'), \u00f6 (o:), \u00fa (u'), \u00fc (u:)
-
a különbözõ kódrendszerekben általában
"problémás" karakterek
-
\u00f4 (o>; o with circumflex, "kupakos" o)
-
\u00f5 (o?; o with tilde, "hullámos" o; HTML-ben - jobb híján
- ezt használjuk õ entitáskóddal megadva)
-
\u0151 (o"; o with double acute, magyar ékezetes "hosszú
õ" betû, pl. fõzés)
-
\u00fb (u>; u with circumflex, "kupakos" u; HTML-ben - jobb híján
- ezt használjuk û entitáskóddal megadva)
-
\u0169 (u?; u with tilde, "hullámos" u)
-
\u0171 (u"; u with double acute, magyar ékezetes "hosszú
û" betû, pl. zûrös)
-
magyar ékezetes nagybetûk és gyakori helyettesítõik
-
\u00c1 (A'), \u00c9 (E'), \u00cd (I')
-
\u00d3 (O'), \u00d6 (O:), \u00da (U'), \u00dc (U:)
-
a különbözõ kódrendszerekben általában
"problémás" karakterek
-
\u00d4 (O>; O with circumflex, "kupakos" O)
-
\u00d5 (O?; O with tilde, "hullámos" O; HTML-ben - jobb híján
- ezt használjuk Õ entitáskóddal megadva)
-
\u0150 (O"; O with double acute, magyar ékezetes "hosszú
Õ" betû)
-
\u00db (U>; U with circumflex, "kupakos" U; HTML-ben - jobb híján
- ezt használjuk Û entitáskóddal megadva)
-
\u0168 (U?; U with tilde, "hullámos" U)
-
\u0170 (U"; O with double acute, magyar ékezetes "hosszú
Û" betû)
-
\u0368..\03f5 (görög betûk)
-
\u0401..\0491 (cirill betûk)
-
\u05d0..\05ea (héber betûk)
-
\u060c..\06f9 (arab betûk)
-
...
Boda István, 2003. május
13.