Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CDIGO UNICODE
02/abril/2014
NDICE
INTRODUCCIN
02
I.
02
II.
DEFINICIN
04
III.
06
IV.
06
V.
06
VI.
07
VII.
07
VIII.
FORMAS DE CODIFICACIN
07
IX.
08
X.
08
XI.
09
XII.
10
XIII.
11
XIV.
PRINCIPALES BENEFICIADOS
14
XV.
14
Pgina 1
CDIGO UNICODE
INTRODUCCION
Existen numerosos sistemas de codificacin que asignan un nmero a cada carcter
(letras, nmeros, signos, etc.). Ninguna codificacin (el cdigo ASCII es un ejemplo
elocuente) especfica puede contener caracteres suficientes. Por ejemplo, la Unin
Europea, por s sola, necesita varios sistemas de codificacin distintos para cubrir
todos sus idiomas. Tambin presentan problemas de incompatibilidad entre los
diferentes sistemas de codificacin. Por esta razn se cre Unicode.
Unicode est llamado a reemplazar al cdigo ASCII y algunos de los restantes ms
populares como Latin-1, en unos pocos aos y a todos los niveles. Permite no slo
manejar texto en prcticamente cualquier lenguaje utilizado en el planeta, sino que
tambin proporciona un conjunto completo y comprensible de smbolos matemticos y
tcnicos que simplificar el intercambio de informacin cientfica.
En el presente trabajo, hablaremos en forma clara y concisa todo lo relacionado al
CDIGO UNICODE, desde su historia hasta el uso con el teclado.
Pgina 2
CDIGO UNICODE
todo el mundo hablaba ingls. Las partidas internacionales de los IBM-PC traan un
conjunto de caracteres OEM, es decir, configurado de fbrica, dependiendo de la
regin del mundo donde iban. Ahora tenamos un ASCII ampliado a 28 caracteres
distintos y adaptado a muchos lenguajes alrededor del mundo, desde el 0 al 127 el
ASCII original se mantiene intacto, pero desde el 128 al 255 depender del conjunto
de caracteres que tenga instalado el PC.
Pero exista un problema, intercambiar documentos entre estos sistemas era difcil
porque no haba manera de que un computador supiera con certeza qu esquema de
codificacin de caracteres haba usado el autor del documento; el computador slo
vea nmeros, y los nmeros pueden significar muchas cosas. Al almacenar estos
documentos en el mismo sitio (como en una tabla de una base de datos); se
necesitara almacenar el tipo de codificacin junto con cada texto, y asegurarse de
adjuntarlo con el texto cada vez que accediese a l. Ahora los documentos
multilinges,
con
caracteres
de
varios
idiomas
en
el
mismo
documento.
Pgina 3
CDIGO UNICODE
del ASCII de 7 bits del 0 al 127, pero lo extiende en el rango 128-255 para tener
caracteres como n-con-una-tilde-sobre-ella (241) y u-con-dos-puntitos-sobre-ella (252).
Y UNICODE usa los mismos caracteres que el ASCII de 7 bits para los nmeros del 0
al 127, y los mismos caracteres que ISO-8859-1 del 128 al 255, y de ah en adelante
se extiende para otros lenguajes que usan el resto de los nmeros, del 256 al 65535.
Puede que en algn momento al tratar con datos UNICODE tengamos la necesidad de
convertirlos en alguno de estos otros sistemas anticuados. Por ejemplo, por necesidad
de integracin con algn sistema computador que espera que sus datos estn en un
esquema especfico de 1 byte, o para imprimirlo en alguna terminal o impresora que
desconozca UNICODE. O para almacenarlo en un documento XML que especifique
explcitamente la codificacin de los caracteres.
II. DEFINICIN
Unicode proviene del ingls:
Universal = universal
Code = cdigo o sea cdigo universal o unicdigo.
Unicode es un sistema de codificacin de caracteres estndar de 16 bits (65536
caracteres), el cual fue desarrollado en 1991 por Unicode Consortium.
Su objetivo es proporcionar el medio por el cual un texto en cualquier forma e idioma
pueda ser codificado para el uso informtico.
El diseo de Unicode esta basado en la simplicidad y consistencia de ASCII, pero va
mucho mas all de la limitada capacidad de ASCII para codificar nicamente el
alfabeto latino.
Pgina 4
CDIGO UNICODE
relacionados,
como
las
propiedades
de
caracteres,
formas
de
aborgenes
canadienses
Cheroqui
Copto
CirlicoDevangar
Esperanto
Etope
Georgiano
Griego
Guyarat
Gurmukhi
Hangul (Coreano)
Katakana)
Hebreo
Jemer (Camboyano)
Kannada (Canars)
Laosiano
Latino
Malayalam
Mongol
Oriya
Siraco
Tailands (Thai)
Tamil
Tibetano
Yi
Zhuyin (Bopomofo)
Pgina 5
CDIGO UNICODE
Lineal B
Fenicio
Rnico
Sumerio
Ugartico
Pgina 6
CDIGO UNICODE
Pgina 7
CDIGO UNICODE
japoneses.
La zona O: No es utilizada actualmente, sin embargo, est reservada para
futuros ideogramas.
La zona R: Es de uso restringido. Se subdivide en rea de uso privado, rea
de compatibilidad y Cdigos especiales. FFFE y FFFF no son cdigos de
carcter y se excluyen especficamente del UNICODE.
Pgina 8
CDIGO UNICODE
Pgina 9
CDIGO UNICODE
000
001
002
"
&
'
003
<
>
004
005
006
007
008
009
00A
00B
00C
00D
00E
Pgina 10
00F
CDIGO UNICODE
CDIGO UNICODE
NOMBRE
2600
2601
2602
2603
2604
2605
2606
2607
2608
2609
260A
260B
260C
260D
260E
260F
2610
2611
2612
2613
261A
261B
261C
261D
261E
261F
2620
2621
2622
2623
2624
2625
Pgina 11
2626
2627
2628
2629
262a
262B
262C
262D
262E
262F
2630
2631
2632
2633
2634
2635
2636
2637
2638
2639
263A
263B
263C
263D
263E
263F
2640
2641
2642
2643
2644
2645
2646
2647
2648
2649
264A
264B
264C
264D
264E
264F
2650
2651
2652
2653
CDIGO UNICODE
Cruz ortodoxa
CHI RHO
Cruz de Lorena
CRUZ DE JERUSALN
STAR y la Media Luna
Farsi SMBOLO
ADI SHAKTI
Martillo y la hoz
Smbolo de la Paz
YIN YANG
Trigramas para el cielo
Trigramas de lago
Trigramas de fuego
Trigramas de trueno
Trigramas de viento
Trigramas de agua
Trigramas de montaa
Trigramas de la tierra
Rueda de dharma
Fruncir el ceo cara blanca
BLANCO rostro sonriente
(presente en WGL4)
NEGRO rostro sonriente
(presente en WGL4)
BLANCO sol con rayos (en la
actualidad WGL4)
Primer trimestre de luna
ltimo trimestre luna
MERCURY
MUJER SIGN (presente en
WGL4)
TIERRA
MACHO SIGN (presente en
WGL4)
JUPITER
SATURNO
URANO
NEPTUNO
PLUTON
ARIES
TAURUS
GEMINI
CNCER
LEN
VIRGO
LIBRA
Scorpius
SAGITARIO
CAPRICORNIO
ACUARIO
PISCIS
Pgina 12
2654
2655
2656
2657
2658
2659
265A
265B
265C
265D
265E
265F
2660
2661
2662
2663
2664
2665
2666
2667
2668
2669
266A
266 b
266C
266D
266E
266F
CDIGO UNICODE
Ajedrez rey blanco
Blanco de ajedrez reina
Torre blanca de ajedrez
Obispo blanco de ajedrez
Caballero blanco de ajedrez
Pen de ajedrez blanco
Rey negro de ajedrez
Negro reina de ajedrez
Negro torre de ajedrez
Obispo negro de ajedrez
Caballero negro de ajedrez
Pen negro de ajedrez
NEGRO SPADE SUIT
Traje blanco corazn
Traje blanco de diamantes
NEGRO CLUB SUIT
SPADE traje blanco
CORAZN NEGRO
DIAMANTE NEGRO SUIT
CLUB traje blanco
Termas
NOTA TRIMESTRE
OCTAVA NOTA (presente en
WGL4)
Vigas de corcheas (presente en
WGL4)
Toma nota de vigas XVI
Msica plana signo
Msica naturales signo
La msica fuerte signo
Pgina 13
CDIGO UNICODE
punto de vista, tiene que ver con la confusin entre caracteres abstractos y sus
formas visuales altamente variables.
Tambin es criticado por no permitir el uso de los smbolos alternos y antiguos
del kanji, lo cual, se dice, que complica el procesamiento del japons antiguo y
de nombres japoneses poco usuales.
El incluir el Lenguaje Thai tambin ha sido criticado por su orden ilgico de
caracteres.
Pgina 14