Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ASCII, acrnimo de American Standard Code for Information Interchange (Cdigo Normalizado Americano para el Intercambio de Informacin). Es un cdigo alfanumrico universalmente aceptado, que asigna valores numricos a las letras, nmeros, signos de puntuacin y algunos otros caracteres. Al normalizar los valores utilizados para dichos caracteres, ASCII permite que los ordenadores, equipos electrnicos y programas informticos intercambien informacin. ASCII incluye 256 cdigos divididos en dos conjuntos, estndar y extendido, de 128 cada uno. Estos conjuntos representan todas las combinaciones posibles de 7 u 8 bits, siendo esta ltima el nmero de bits en un byte. El conjunto ASCII bsico, o estndar, utiliza 7 bits para cada cdigo, lo que da como resultado 128 cdigos de caracteres desde 0 hasta 127 (00H hasta 7FH hexadecimal). El conjunto ASCII extendido utiliza 8 bits para cada cdigo, dando como resultado 128 cdigos adicionales, numerados desde el 128 hasta el 255 (80H hasta FFH extendido). En el conjunto de caracteres ASCII bsico, los primeros 32 valores estn asignados a los cdigos de control de comunicaciones y de impresora caracteres no imprimibles, como retroceso, retorno de carro y tabulacin empleados para controlar la forma en que la informacin es transferida desde una computadora a otra o desde una computadora a una impresora. Los 96 cdigos restantes se asignan a los signos de puntuacin corrientes, a los dgitos del 0 al 9 y a las letras maysculas y minsculas del alfabeto latino. Los cdigos de ASCII extendido, del 128 al 255, se asignan a conjuntos de caracteres que varan segn los fabricantes de computadoras y programadores de software. Estos cdigos no son intercambiables entre los diferentes programas y computadoras como los caracteres ASCII estndar. Por ejemplo, IBM utiliza un grupo de caracteres ASCII extendido que suele denominarse conjunto de caracteres IBM extendido para sus computadoras personales. Apple Computer utiliza un grupo similar, aunque diferente, de caracteres ASCII extendido para su lnea de computadoras Macintosh. Por ello, mientras que el conjunto de caracteres ASCII estndar es universal en el hardware y el software de los microordenadores, los caracteres ASCII extendido pueden interpretarse correctamente slo si un programa, computadora o impresora han sido diseados para ello. Historia del Cdigo ASCII : El cdigo ASCII (siglas en ingls para American Standard Code for Information Interchange, es decir Cdigo Americano (estadounidense) Estndar para el intercambio de Informacin )(se pronuncia Aski). Fue creado en 1963 por el Comit Estadounidense de Estndares o "ASA", este organismo cambio su nombre en 1969 por "Instituto Estadounidense de Estndares Nacionales" o "ANSI" como se lo conoce desde entonces.
Este cdigo naci a partir de reordenar y expandir el conjunto de smbolos y caracteres ya utilizados por ese entonces en telegrafa por la compaa Bell. En un primer momento solo inclua las letras maysculas, pero en 1967 se agregaron las letras minsculas y algunos caracteres de control, formando as lo que se conoce como US-ASCII, es decir los cdigos del 0 al 127. As con este conjunto de solo 128 caracteres fue publicado en 1967 como estndar, conteniendo todos lo necesario para escribir en idioma ingls. En 1981, la empresa IBM desarroll una extensin de 8 bits del cdigo ASCII, llamada "pgina de cdigo 437", en esta versin se reemplazaron algunos caracteres de control obsoletos, por caracteres grficos. En 1986, se modific el estndar para agregar nuevos caracteres latinos, necesarios para la escrituras de textos en otros idiomas, como por ejemplo el espaol, as fue como se agregaron los caracteres que van del ASCII 128 al 255. Casi todos los sistemas informticos de la actualidad utilizan el cdigo ASCII para representar caracteres y textos
CDIGO UNICODE
Superconjunto de caracteres, basado en el conjunto ASCII, pero que utiliza una definicin de dos bytes por carcter, en vez de uno; esto permite definir cdigos de caracteres (o conjuntos de caracteres) con ms de las 256 entradas posibles del estndar ASCII, dado que un solo byte puede definir 256 valores distintos, mientras que una palabra de dos bytes puede definir 65.536. Su definicin es mantenida por el denominado Unicode Consortium, del que forman parte empresas como Adobe, Apple, IBM, Microsoft, HewlettPackard, Oracle, Nokia, NCR, Sun Microsystems y otras, lderes del mundo de la informtica y las telecomunicaciones. El estndar ISO, ms amplio, utiliza palabras de 4 bytes, pero tiene en cuenta el cdigo Unicode como un subconjunto (se trata de los 65.536 primeros caracteres del cdigo ISO10646). Los caracteres de Unicode abarcan toda clase de tipografas y smbolos, desde los latinos hasta los asiticos (pasando por smbolos matemticos, de moneda y sistema Braille, entre otros), con un nico valor identificativo, lo que evita tener que instalar conjuntos de caracteres especficos para cada alfabeto. Historia del Cdigo UNICODE Antes de Unicode, haba diferentes sistemas de codificacin de caracteres para cada idioma, cada uno usando los mismos nmeros (0-255) para representar los caracteres de ese lenguaje. Algunos (como el ruso) tienen varios estndares incompatibles que representan los mismos caracteres; otros idiomas (como el japons) tienen tantos caracteres que precisan ms de un byte. Intercambiar documentos entre estos sistemas era difcil porque no haba manera de que un computador supiera con certeza qu esquema de codificacin de caracteres haba usado el autor del documento; el computador slo vea nmeros, y los nmeros pueden significar muchas cosas. Para resolver estos problemas se dise Unicode. El proyecto Unicode se inici a finales de 1987, tras conversaciones entre los ingenieros de Apple y Xerox: Joe Becker, Lee Collins y Mark Davis. Como resultado de su colaboracin, en agosto de 1988 se public el primer borrador de Unicode bajo el nombre de Unicode88. Esta primera versin, con cdigos de 16 bits, se public asumiendo que solo se codificaran los caracteres necesarios para el uso moderno. Durante el ao 1989 el trabajo continu con la adicin de colaboradores de otras compaas como Microsoft o Sun Microsystems. El Consorcio Unicode se form el 3 de febrero de 1991 y en octubre de 1991 se public la primera versin del estndar. La segunda versin, incluyendo escritura ideogrfica Han se public en junio de 1992.
0A00 0A7F Gurmukhi 0A80 0AFF Gujarati 0B00 0B7F Oriya 0B80 0BFF 0C80 0CFF Tamil Kannada 0C00 0C7F Telugu 0D00 0D7F Malayalam 0D80 0DFF Sinhala 0E00 0E7F 0E80 0EFF 0F00 0FFF 1000 109F 10A0 10FF 1100 11FF 1200 137F 13A0 13FF 1400 167F 1680 169F 16A0 16FF 1700 171F 1720 173F 1740 175F 1760 177F 1780 17FF 1900 194F 1950 197F 19E0 19FF 1E00 1EFF 1F00 1FFF Thai Lao Tibetan Myanmar Georgian Hangul Jamo Ethiopic Cherokee Unified Canadian Aboriginal Syllabics Ogham Runic Tagalog Hanunoo Buhid Tagbanwa Khmer Limbu Tai Le Khmer Symbols Latin Extended Additional Greek Extended
20A0 20CF Currency Symbols 2100 214F 2150 218F 2190 21FF 2200 22FF 2300 23FF 2400 243F 2440 245F 2460 24FF 2500 257F Letterlike Symbols Number Forms Arrows Mathematical Operators Miscellaneous Technical Control Pictures Optical Character Recognition Enclosed Alphanumerics Box Drawing
20D0 20FF Combining Diacritical Marks for Symbols 10450 1047F 10800 1083F
10480 104AF Osmanya 1D000 1D0FF Byzantine Musical Symbols 1D100 1D1FF Musical Symbols 1D300 1D35F Tai Xuan Jing Symbols 1D400 1D7FF Mathematical Alphanumeric Symbols 20000 2A6DF CJK Unified Ideographs Extension B 2F800 2FA1F E0000 E007F CJK Compatibility Ideographs Supplement Tags
Referencias bibliogrficas:
[1] [2] [3] [4] [5] Microsoft Student con Encarta Premium 2009 DVD http://informatica.dgenp.unam.mx/recomendaciones/codigo-ascii http://juanmancilla.wordpress.com/tag/codigo-ascii/ http://www.ecured.cu/index.php/Lenguaje_Unicode http://jrgraphix.net/research/unicode_blocks.php