en esta unidad hablaremos de la representación de los ... · el código ascii usa siete bits, así...

18
En esta unidad hablaremos de la representación de los caracteres.

Upload: lykiet

Post on 27-Sep-2018

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

En esta unidad hablaremos de la representación de los caracteres.

Page 2: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

La representación de texto es diferente de la representación de

números, en el sentido que el texto solo es una convención creada por

los humanos. Para representar caracteres de texto en binario se

emplea una tabla de traducción creada por un comité.

Page 3: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

La tabla de traducción más empleada es la del código ASCII. Se

desarrolló para comunicaciones telegráficas. Tiene una longitud fija

para todas las letras y dos estados(punto o raya), así que era muy

sencillo traducirlo al binario.

Page 4: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

El código ASCII usa siete bits, así que podemos representar 128

caracteres diferentes. En la tabla podemos ver los primeros 3 bits en la

parte de arriba y los 4 últimos en la parte de la izquierda.

Page 5: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Las primeras 32 combinaciones son caracteres de control, no

imprimibles (cosas como el inicio de una transmisión, retorno de carro,

alimentación de líneas)

Page 6: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Los números se codifican asumiendo que los últimos 4 bits son el valor

numérico de la cifra

Page 7: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Las letras mayúsculas y las minúsculas se diferencia por un bit.

Page 8: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

EBCDIC fue creado por IBM para las tarjetas perforadas que usaban

los primeros ordenadores

Page 9: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Se usaba en los computadores centrales tres seis cero.

Page 10: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Las letras se representan en 3 bloques

Page 11: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Y los números siguen el mismo criterio que con ASCII , pero con una

codificación diferente

Page 12: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

El problema con estos códigos era que los sets de caracteres que

representaban eran demasiado pequeños, por tanto, se creo Unicode

Page 13: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Unicode es un codificación “lingüística-independiente” con suficiente

espacio para representar cualquier carácter de cualquier lengua del

mundo

Page 14: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Es, por tanto, una representación universal y uniforme, ya que usa una

longitud de codificación fija. Cada carácter tiene una única codificación

y cada codificación pertenece a un único carácter.

Page 15: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Unicode tienen 3 codificaciones principales. UTF-8 es una de ellas. Es

el más extendido por los navegadores web. Por ejemplo, permite la

combinación de carácter de diferentes lenguas en una misma página

web, como podemos ver en Wikipedia.

Page 16: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

UTF-8 utiliza una representación de longitud variable, con los números

representados por 1 a 4 bytes. Los caracteres con un byte se asocian

directamente con la tabla ASCII. Los caracteres de lenguas románicas,

griego, árabe, cirílico y otros están codificadas con dos bytes. Tres

bytes están reservados para el grupo chino, japonés y coreano. Por

último, los caracteres suplementarios se incluyen mediante el uso de

un cuarto byte.

Page 17: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los

Por ejemplo aquí podemos ver la representación de algunos símbolos

monetarios en UTF-8

Page 18: En esta unidad hablaremos de la representación de los ... · El código ASCII usa siete bits, así que podemos representar 128 caracteres diferentes. En la tabla podemos ver los