Sei sulla pagina 1di 3

TABELLA CARATTERI ASCII

I caratteri evidenziati nella cornice


utilizzato.

possono risultare differenti a seconda del software

La tabella ASCII (American Standard Code for Information Interchange) un codice convenzionale,
a 7 bit (quindi formati da 128 caratteri a partire da 0) usato per la rappresentazione dei caratteri di
testo attraverso i byte: ad ogni byte viene fatto corrispondere un diverso carattere della tastiera
(lettere, numeri, segni).
In realt lo standard ASCII copre solo i primi 128 byte (da 0000000 a 1111111), i successivi byte (e
quindi a 8 bit) fino al 256 costituiscono la tabella ASCII estesa che presenta varie versioni a
carattere nazionale.
Nella tabella ASCII standard si trovano sia cifre e numeri che le lettere maiuscole e minuscole
(maiuscole e minuscole hanno codici ASCII differenti), la punteggiatura, i simboli aritmetici e altri
simboli ($, &, %, @, #, ecc.). Essendo stata concepita in America, la tabella ASCII standard non
comprende le lettere accentate (sconosciute all'ortografia inglese). I primi 32 byte della tabella
standard sono inoltre riservati per segnali di controllo e funzioni varie.
I Byte da 0 a 31 sono riservati per dei segnali di controllo. Se si sta usando Windows si pu ottenere
ogni carattere ASCII tenendo premuto il tasto Alt e digitando il codice decimale corrispondente col
tastierino numerico (se il tastierino numerico non fosse attivo, premere prima il tasto Num lock o Bloc
Num per attivarlo). per esempio la chiocciola @ si ottiene digitando 64 mentre si tiene premuto il
tasto Alt. Nella tastiera inglese sono gi presenti tutti i caratteri della tabella standard; nella tastiera
italiana invece mancano l'apice (96), le parentesi graffe (123,125) e la tilde (126).
L'alfabeto latino, usato nella scrittura di molte lingue nel mondo, presenta una grande quantit di
varianti grafiche: si va dalle semplici vocali accentate (accento grave , acuto , circonflesso ,
dieresi , tilde ) a lettere modificate (lettere con barrette, cediglie, segni), lettere speciali usate solo
in una lingua, segni di punteggiatura particolari (il punto interrogativo ed il punto esclamativo
capovolti usati nello spagnolo), simboli di valuta, e cos via, senza considerare poi che gran parte di
questi segni presentano le due forme maiuscola e minuscola.
Le varianti sono talmente numerose che i 128 byte della tabella estesa non sono purtroppo sufficienti
a rappresentarle tutte, per questo motivo esistono diverse estensioni della tabella ASCII: lo standard
ISO 8859 prevede 15 diverse estensioni, comprese quelle per gli alfabeti diversi dal latino, ma
esistono anche ulteriori estensioni non riconosciute dall'ISO e create per esempio dalla Microsoft per
i sistemi Windows o dalla Apple per i Macintosh. Persino l'MS-DOS usava un'estensione diversa da
quella di Windows. La tabella ASCII estesa tipicamente utilizzata in Italia quella dell'Europa
occidentale, creata per le lingue germaniche e neolatine (escluso il rumeno). Altre estensioni usate in
Europa sono la Centro Europea per i paesi dell'Europa orientale (lingue slave, ungherese, rumeno),
la Turca, la Cirillica e la Greca.
Per cercare di ovviare al problema stato creato un nuovo standard internazionale detto Unicode,
definito dalla Unicode Consortium e dalla International Organization for Standardization (ISO
10646), che rappresenta i caratteri usando 2 byte (16 bit). Con 2 byte il numero di combinazioni
possibili diventa 256x256 = 65.536, perci Unicode supporta 65.536 diversi segni, al posto dei 256
del set ASCII. Si riescono cos a rappresentare non solo tutte le varianti dell'alfabeto latino, ma anche
tutti gli altri alfabeti (greco, cirillico, arabo, ebraico...) oltre all'insieme degli ideogrammi cinesi e
giapponesi (che sono in tutto circa 30.000, anche se poi ne vengono effettivamente utilizzati solo
poche migliaia). Lo standard definitivo ancora in corso di definizione, ma i codici disponibili sono
cos numerosi, che pare verranno inseriti in Unicode persino gli alfabeti di fantasia come l'Elfico di
Tolkien o il Klingon di Star Trek. Lo svantaggio dell'Unicode, rispetto all'ASCII, che le dimensioni
dei file di testo risultano comunque raddoppiate (vengono usati 2 byte per carattere, invece di 1 solo).
La tabella riportata di seguito quella usata da Windows italiano; gi la versione inglese di Windows
usa tabella diversa. I caratteri si ottengono tenendo premuto il tasto Alte digitando col tastierino
numerico il codice decimale corrispondente (se il tastierino numerico non fosse attivo, premere il
tasto Num lock o Bloc Num per attivarlo). Per esempio la (doppia "s" tedesca) si ottiene digitando
225 mentre si tiene premuto il tasto Alt. Sulla tastiera italiana sono comunque gi disponibili alcune
delle lettere accentate (ma non le lettere accentate maiuscole).
Si osservi come nella tabella estesa si trovino ripetuti pi volte alcuni segni (per esempio: + - _ ) che
peraltro sono pure compresi nella tabella standard. Si tratta in effetti di byte non definiti a cui stato
assegnato un simbolo pi o meno a caso.

Caratteri non stampabili della tabella ASCII


Binario Ottale Decimale Esadecimale Abbr PR CS CEC
\0

Descrizione

000 0000

000

00

NUL ^@

000 0001

001

01

SOH ^A

Start of Header

000 0010

002

02

STX

^B

Start of Text

000 0011

003

03

ETX

^C

End of Text

000 0100

004

04

EOT

^D

End of Transmission

000 0101

005

05

ENQ ^E

Enquiry

000 0110

006

06

ACK

Acknowledgment

000 0111

007

07

BEL

^G

\a

Bell

000 1000

010

08

BS

^H

\b

Backspace (in molti sistemi comune che prenda il


codice di "Delete")

000 1001

011

09

HT

^I

\t

Horizontal Tab

000 1010

012

10

0A

LF

^J

\n

Line feed

000 1011

013

11

0B

VT

^K

\v

Vertical Tab

000 1100

014

12

0C

FF

^L

\f

Form feed

000 1101

015

13

0D

CR

^M

\r

Carriage return

000 1110

016

14

0E

SO

^N

Shift Out

000 1111

017

15

0F

SI

^O

Shift In

001 0000

020

16

10

DLE

001 0001

021

17

11

DC1

^Q

Device Control 1 (oft. XON)

001 0010

022

18

12

DC2

^R

Device Control 2

001 0011

023

19

13

DC3

001 0100

024

20

14

DC4

^T

001 0101

025

21

15

NAK ^U

Negative Acknowledgement

001 0110

026

22

16

SYN ^V

Synchronous Idle

001 0111

027

23

17

ETB

End of Trans. Block

001 1000

030

24

18

CAN ^X

Cancel

001 1001

031

25

19

EM

^Y

End of Medium

001 1010

032

26

1A

SUB

[^Z

Substitute

001 1011

033

27

1B

ESC

^[

Escape

001 1100

034

28

1C

FS

^\

File Separator

001 1101

035

29

1D

GS

^]

Group separator

001 1110

036

30

1E

RS

^^

Record Separator

001 1111

037

31

1F

US

^_

Unit Separator

111 1111

177

127

7F

DEL

^?

Delete (in molti sistemi comune che abbia un altro


codice)

^F

^P

^S

^W

Null character

Data Link Escape

Device Control 3 (oft. XOFF)


Device Control 4