organización del computador 1 representación binaria de números reales sistemas de...

Organización del Computador 1Organización del Computador 1

Representación binaria de Representación binaria de Números RealesNúmeros Reales

Sistemas de RepresentaciónSistemas de Representación

Representación de la InformaciónRepresentación de la Información Bit: Bit: (Binary Digit) Un bit es un dígito binario. Como tal, puede (Binary Digit) Un bit es un dígito binario. Como tal, puede

tener 2 valores posibles, 1 y 0. Como los circuitos de una tener 2 valores posibles, 1 y 0. Como los circuitos de una

computadora pueden asumir 2 estados, los bits se utilizan para computadora pueden asumir 2 estados, los bits se utilizan para

representar el estado de los circuitos. Y siendo uno de estos representar el estado de los circuitos. Y siendo uno de estos

circuitos la unidad mínima de almacenamiento que posee una circuitos la unidad mínima de almacenamiento que posee una

computadora, el bit será la mínima unidad de representación.computadora, el bit será la mínima unidad de representación.

Byte: Byte: En términos generales, un byte es un conjunto de bits. En En términos generales, un byte es un conjunto de bits. En

el presente, se entiende como byte al conjunto de 8 bits.el presente, se entiende como byte al conjunto de 8 bits.

Palabra: Palabra: Una palabra es el conjunto de bits que pueden ser Una palabra es el conjunto de bits que pueden ser

accedidos por la CPU en un requerimiento de lectura/escritura.accedidos por la CPU en un requerimiento de lectura/escritura.

Tipo de Datos que se representan Tipo de Datos que se representan con unos y ceroscon unos y ceros

NúmerosNúmeros: enteros positivos y negativos, y : enteros positivos y negativos, y fracciones.fracciones.

LetrasLetras: Todas las letras del alfabeto : Todas las letras del alfabeto (mayúsculas y minúsculas), símbolos de (mayúsculas y minúsculas), símbolos de puntuación, símbolos matemáticos, etc.puntuación, símbolos matemáticos, etc.

Caracteres de controlCaracteres de control: caracteres para : caracteres para limpiar la pantalla, saltar una línea, etc.limpiar la pantalla, saltar una línea, etc.

Instrucciones de programaInstrucciones de programa.. Direcciones de memoriaDirecciones de memoria..

Tipos de datos: Números realesTipos de datos: Números reales El rango de los El rango de los

números reales números reales comprende desde comprende desde --∞∞ hasta + hasta +∞∞..

Los registros de Los registros de un procesador un procesador tienen resolución tienen resolución finita.finita.

Por lo tanto un Por lo tanto un computador solo computador solo puede representar puede representar un subconjunto de un subconjunto de RR . (No es solo un . (No es solo un tema de magnitud tema de magnitud sino de resolución)sino de resolución)

Representación binaria de Números Representación binaria de Números RealesReales

En general podemos formalizar la En general podemos formalizar la representación de un número real expresado representación de un número real expresado en los siguientes formatos:en los siguientes formatos: Punto Fijo Punto Fijo

• Con SignoCon Signo• Con Notación Complemento a 2 Con Notación Complemento a 2

Punto FlotantePunto Flotante

Representación Punto FijoRepresentación Punto Fijo

Se representan mediante una expresión del tipo:Se representan mediante una expresión del tipo:

(a(annaan-1n-1 …a …a0 0 . a. a-1-1aa-2-2 …a …a-m-m))2 2

= = (a(ann22nn+…+ a+…+ a002200+ a+ a-1-122-1-1+ a+ a-2-222-2-2+ …+ a+ …+ a-m-m 2 2-m-m) )

donde:donde: aaii ∈ ∈ enteros y enteros y 0 ≤ 0 ≤ aaii ≤ 1, para todo ≤ 1, para todo i = -m, …-1, 0, 1, …ni = -m, …-1, 0, 1, …n

Distancia entre dos números consecutivos es Distancia entre dos números consecutivos es 22-m -m y y por lo tanto deja de ser un rango continuo de por lo tanto deja de ser un rango continuo de números para transformarse en un rango discreto.números para transformarse en un rango discreto.

Representación Punto Fijo con SignoRepresentación Punto Fijo con Signo

Representar números de punto fijo con signo Representar números de punto fijo con signo requiere:requiere:

Representar la parte entera con signo usando alguno de Representar la parte entera con signo usando alguno de los métodos presentados para números enteros (signed los métodos presentados para números enteros (signed magnitude, complemento a 1, complemento a 2, etc.), ymagnitude, complemento a 1, complemento a 2, etc.), y

Representar la parte fraccionaria a través de un simple Representar la parte fraccionaria a través de un simple cambio de base a binario. cambio de base a binario.

Truncamiento y RedondeoTruncamiento y Redondeo

Cuando la cantidad de dígitos disponible no alcanza Cuando la cantidad de dígitos disponible no alcanza para representar el número …para representar el número …

ProblemaProblema: Representar un número de : Representar un número de nn dígitos dígitos decimales en un sistema con decimales en un sistema con mm dígitos decimales, dígitos decimales, siendo siendo m < nm < n

TruncamientoTruncamiento: descarta los dígitos fraccionarios de : descarta los dígitos fraccionarios de orden mayor a orden mayor a mm. El error es de 1 bit.. El error es de 1 bit.

RedondeoRedondeo: descarta los dígitos fraccionarios de : descarta los dígitos fraccionarios de orden mayor a orden mayor a mm pero se suma 1 al menos pero se suma 1 al menos significativo en caso que el bit inmediato descartado significativo en caso que el bit inmediato descartado valga 1. Equivale a truncar y sumarle 0,5*2valga 1. Equivale a truncar y sumarle 0,5*2 -m -m . El . El error es de ½ bit.error es de ½ bit.

Números reales: RepresentaciónNúmeros reales: Representación Para el caso de los números reales se trabaja en Para el caso de los números reales se trabaja en

notación científicanotación científica..

n = n = ±±f f xx10 10 ee

-725.832 = -7.25832 x 10-725.832 = -7.25832 x 102 2 = -725.832 x 10= -725.832 x 1000

3.14 = 0.314 x 103.14 = 0.314 x 1011 = 3.14 x10 = 3.14 x1000

0.000001 = 0.1 x 100.000001 = 0.1 x 10-5-5 = 1.0 x 10 = 1.0 x 10-6-6

1941 = 0.1941 x 101941 = 0.1941 x 1044 = 1.941 x 10 = 1.941 x 1033

Para unificar la representación se recurre a la Para unificar la representación se recurre a la notación científica normalizadanotación científica normalizada, en donde, en donde

0 .10 .1 ≤≤ f < 1 f < 1 yy

e e es un entero con signo. es un entero con signo.

Números reales: RepresentaciónNúmeros reales: Representación

En el sistema binario la expresión de un número en En el sistema binario la expresión de un número en notación científica normalizada es:notación científica normalizada es:

n = n = ±±f f xx 2 2 ee

en donde:en donde:

0 .50 .5 ≤≤ f < 1 f < 1 y y

ee es un entero con signo es un entero con signo..

Representación en Punto FlotanteRepresentación en Punto Flotante Se representan con los pares de valores (m, e), denotando:Se representan con los pares de valores (m, e), denotando:

(m, e) = m b⋅(m, e) = m b⋅ ee

mm llamado llamado mantisamantisa, y que representa un número fraccionario, y que representa un número fraccionario ee llamado llamado exponenteexponente, , al cual se debe elevar la base al cual se debe elevar la base

numérica numérica bb de representación para obtener el valor real de representación para obtener el valor real Mantisa y exponente pueden representarse:Mantisa y exponente pueden representarse:

con signocon signo sin signosin signo con notación complementocon notación complemento con notación exceso m. con notación exceso m.

Para que las representaciones sean únicas, la mantisa Para que las representaciones sean únicas, la mantisa deberá estar normalizada. deberá estar normalizada.

Punto Flotante NormalizadoPunto Flotante Normalizado

Conversión de un número al formatoConversión de un número al formatopunto flotante normalizadopunto flotante normalizado

Dado un número real w, planteamos el método para obtener su Dado un número real w, planteamos el método para obtener su representación de punto flotante normalizado en base representación de punto flotante normalizado en base 22. Se notará . Se notará con con e e al exponente y con al exponente y con f f a la fracción.a la fracción.

Determinar el exponente. Para ello hallar el valor de Determinar el exponente. Para ello hallar el valor de e e que que satisface:satisface:

22e-1e-1 ≤ |w| < ≤ |w| < 22ee.. Determinar la fracción y hallar su representación en base 2. Determinar la fracción y hallar su representación en base 2.

Por definición,Por definición,

||f f | | = = |w| / 2|w| / 2ee.. Armar la representación del número según la convención Armar la representación del número según la convención

que se haya acordado. Por lo general, se establece que el que se haya acordado. Por lo general, se establece que el primer dígito de la representación representa al signo de la primer dígito de la representación representa al signo de la fracción, los fracción, los k k dígitos siguientes al exponente en alguna dígitos siguientes al exponente en alguna notación (con complemento o exceso notación (con complemento o exceso mm) y los) y los dígitos dígitos siguientes a la fracción.siguientes a la fracción.

Punto Flotante: Formato IEEE 574Punto Flotante: Formato IEEE 574 IEEE (Institute of Electrical and Electronics IEEE (Institute of Electrical and Electronics

Engineers, Inc.)Engineers, Inc.) El Standard IEEE 754 para punto flotante binario es El Standard IEEE 754 para punto flotante binario es

el mas ampliamente utilizado. En este Standard se el mas ampliamente utilizado. En este Standard se especifican los formatos para 32 bits, 64 bits, y 80-especifican los formatos para 32 bits, 64 bits, y 80-bits.bits.

IEEE 574: RangosIEEE 574: Rangos

Problemas que surgen del trabajo conProblemas que surgen del trabajo connúmeros de Punto Flotantenúmeros de Punto Flotante

Overflow, underflow y números no inicializados.Overflow, underflow y números no inicializados.

El estándar IEEE 574 trata con estos problemas de manera El estándar IEEE 574 trata con estos problemas de manera

explícita, y define además de los números normalizados, otros explícita, y define además de los números normalizados, otros

cuatro tipos de números, que se muestran a continuación.cuatro tipos de números, que se muestran a continuación. Números finitos de-normalizadosNúmeros finitos de-normalizados

Números finitos normalizadosNúmeros finitos normalizados

Ceros signadosCeros signados

Infinitos signadosInfinitos signados

NaNs (Not a Number)NaNs (Not a Number)

Números IndefinidosNúmeros Indefinidos

Problemas que surgen del trabajo conProblemas que surgen del trabajo connúmeros de Punto Flotantenúmeros de Punto Flotante

Ceros signadosCeros signados Una operación puede dar +0 o -0 en función del bit Una operación puede dar +0 o -0 en función del bit

de signo. de signo. En ambos casos el valor es el mismo. El signo de En ambos casos el valor es el mismo. El signo de

un resultado cero depende de la operación en sí y un resultado cero depende de la operación en sí y del modo de redondeo utilizado. del modo de redondeo utilizado.

Los ceros signados ayudan a interpretar el intervalo Los ceros signados ayudan a interpretar el intervalo aritmético en el que se ubicaría el resultado si la aritmético en el que se ubicaría el resultado si la precisión aritmética fuese mayor. precisión aritmética fuese mayor.

Indican la dirección desde la cual ocurrió el Indican la dirección desde la cual ocurrió el redondeo a cero, o el signo de un infinito que fue redondeo a cero, o el signo de un infinito que fue invertido.invertido.

Números finitos normalizadosNúmeros finitos normalizados El rango de éstos números se compone de todos El rango de éstos números se compone de todos

los valores finitos distintos de cero codificables en los valores finitos distintos de cero codificables en

formato de números reales entre 0 e formato de números reales entre 0 e . . En el formato de punto flotante simple precisión En el formato de punto flotante simple precisión

estos números se componen de todos aquellos estos números se componen de todos aquellos cuyos exponentes desplazados van de 1 a 254, (no cuyos exponentes desplazados van de 1 a 254, (no desplazados van de -126 a 127).desplazados van de -126 a 127).

Cuando se aproximan a cero, estos números no Cuando se aproximan a cero, estos números no pueden seguir expresándose en este formato, ya pueden seguir expresándose en este formato, ya que el rango del exponente no puede compensar el que el rango del exponente no puede compensar el desplazamiento a izquierda del punto decimal.desplazamiento a izquierda del punto decimal.

Cuando se llega a un exponente cero en un número Cuando se llega a un exponente cero en un número normalizado, se pasa al rango de-normalizado. normalizado, se pasa al rango de-normalizado.

Números finitos de-normalizadosNúmeros finitos de-normalizados En general las operaciones entre números En general las operaciones entre números

normalizados arrojan como resultado otro número normalizados arrojan como resultado otro número normalizado.normalizado.

Si hay underflow se pasa a trabajar en formato de-Si hay underflow se pasa a trabajar en formato de-normalizado.normalizado.

Ej:Ej:

Bits de pérdida de precisión

Infinitos signadosInfinitos signados

++ y -y -, representan los máximos números reales , representan los máximos números reales positivo y negativo representables en formato de positivo y negativo representables en formato de unto flotanteunto flotante

La mantisa siempre es 1.000....00, y el máximo La mantisa siempre es 1.000....00, y el máximo exponente desplazado representable (p. Ej. 255 exponente desplazado representable (p. Ej. 255 para precisión simple)para precisión simple)

NaNsNaNs

Not a Number. Not a Number. No son parte del rango de números reales.No son parte del rango de números reales. QNaN: Quiet NaN tiene el bit mas significativo QNaN: Quiet NaN tiene el bit mas significativo

fraccional en 1. Pueden propagarse por posteriores fraccional en 1. Pueden propagarse por posteriores operaciones sin generar una excepción.operaciones sin generar una excepción.

SNaN: Signaled NAN. Tiene en cero el bit fraccional SNaN: Signaled NAN. Tiene en cero el bit fraccional mas significativo. Resulta de una operación inválida mas significativo. Resulta de una operación inválida de punto flotante.de punto flotante.

ASCIIASCII American Standard Code for Information InterchangeAmerican Standard Code for Information Interchange Hay 95 caracteres ASCII imprimibles, numerados del 32 al 126.Hay 95 caracteres ASCII imprimibles, numerados del 32 al 126. Es un código de caracteres basado en el alfabeto latino tal Es un código de caracteres basado en el alfabeto latino tal

como se usa en inglés moderno y en otras lenguas como se usa en inglés moderno y en otras lenguas occidentales. occidentales.

Fue creado en 1963 por el Comité Estadounidense de Fue creado en 1963 por el Comité Estadounidense de Estándares (ASA, conocido desde 1969 como el Instituto Estándares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estándares Nacionales, o ANSI) como una Estadounidense de Estándares Nacionales, o ANSI) como una refundición o evolución de los conjuntos de códigos utilizados refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía. entonces en telegrafía.

En 1967, se incluyeron las minúsculas, y se redefinieron En 1967, se incluyeron las minúsculas, y se redefinieron algunos códigos de control para formar el código conocido algunos códigos de control para formar el código conocido como como US-ASCIIUS-ASCII..

ASCIIASCII El código ASCII utiliza 7 bits para representar los caracteres, El código ASCII utiliza 7 bits para representar los caracteres,

aunque inicialmente empleaba un bit adicional (bit de aunque inicialmente empleaba un bit adicional (bit de paridad) para detectar errores en la transmisión. paridad) para detectar errores en la transmisión.

A menudo se llama incorrectamente ASCII a otros A menudo se llama incorrectamente ASCII a otros códigos códigos de caracteres de 8 bitsde caracteres de 8 bits, como el estándar ISO-8859-1 que es , como el estándar ISO-8859-1 que es una extensión que utiliza 8 bits para proporcionar caracteres una extensión que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al inglés.adicionales usados en idiomas distintos al inglés.

En la actualidad define códigos para 33 caracteres no En la actualidad define códigos para 33 caracteres no imprimibles, de los cuales la mayoría son caracteres de imprimibles, de los cuales la mayoría son caracteres de control obsoletos que tienen efecto sobre como se procesa control obsoletos que tienen efecto sobre como se procesa el texto, más otros 95 caracteres imprimibles que les siguen el texto, más otros 95 caracteres imprimibles que les siguen en la numeración (empezando por el carácter espacio).en la numeración (empezando por el carácter espacio).

Casi todos los sistemas informáticos actuales utilizan el Casi todos los sistemas informáticos actuales utilizan el código ASCII o una extensión compatible para representar código ASCII o una extensión compatible para representar textos y para el control de dispositivos que manejan texto.textos y para el control de dispositivos que manejan texto.

ISO 8859-1ISO 8859-1

UnicodeUnicode

Estándar industrial cuyo objetivo es proporcionar el Estándar industrial cuyo objetivo es proporcionar el medio por el cual un texto en cualquier forma e medio por el cual un texto en cualquier forma e idioma pueda ser codificado para el uso informático.idioma pueda ser codificado para el uso informático.

El establecimiento de Unicode ha involucrado un El establecimiento de Unicode ha involucrado un ambicioso proyecto para reemplazar los esquemas ambicioso proyecto para reemplazar los esquemas de codificación de caracteres existentes, muchos de codificación de caracteres existentes, muchos de los cuales están muy limitados en tamaño y son de los cuales están muy limitados en tamaño y son incompatibles con entornos multilingües. incompatibles con entornos multilingües.

Implementado en un número considerable de Implementado en un número considerable de tecnologías recientes, que incluyen XML, Java y tecnologías recientes, que incluyen XML, Java y Sistemas Operativos modernos.Sistemas Operativos modernos.

UTF-8UTF-8 UTF-8UTF-8 (8-bit Unicode Transformation Format) es una norma de (8-bit Unicode Transformation Format) es una norma de

transmisión de longitud variable para caracteres codificados transmisión de longitud variable para caracteres codificados utilizando Unicode.utilizando Unicode.

Usa grupos de bytes para representar el estándar de Unicode Usa grupos de bytes para representar el estándar de Unicode para los alfabetos de muchos de los lenguajes del mundo. para los alfabetos de muchos de los lenguajes del mundo.

Especialmente útil para la transmisión sobre sistemas de Especialmente útil para la transmisión sobre sistemas de correo de 8 bits.correo de 8 bits.

Usa 1 a 4 bytes por carácter, en función del símbolo Unicode. Usa 1 a 4 bytes por carácter, en función del símbolo Unicode. PE: se necesita un solo byte en UTF-8 para codificar los 128 PE: se necesita un solo byte en UTF-8 para codificar los 128 caracteres US-ASCII en el rango U+0000 a U+007F Unicode.caracteres US-ASCII en el rango U+0000 a U+007F Unicode.

No es afectado al utilizar compresión de datos.No es afectado al utilizar compresión de datos. El IETF requiere que todos los protocolos de Internet indiquen El IETF requiere que todos los protocolos de Internet indiquen

qué codificación utilizan para los textos, y que UTF-8 esté entre qué codificación utilizan para los textos, y que UTF-8 esté entre las mismas.las mismas.

UTF-8: VentajasUTF-8: Ventajas Puede codificar cualquier carácter. Puede codificar cualquier carácter. Ahorra espacio respecto de UTF-16 o UTF-32 que Ahorra espacio respecto de UTF-16 o UTF-32 que

utilizan muchos caracteres ASCII de 7 bits. utilizan muchos caracteres ASCII de 7 bits. Una secuencia de bytes para un carácter jamás será Una secuencia de bytes para un carácter jamás será

parte de una secuencia más larga de otro carácter parte de una secuencia más larga de otro carácter como lo hacían viejas codificaciones.como lo hacían viejas codificaciones.

El primer byte de una secuencia multi-byte es El primer byte de una secuencia multi-byte es suficiente para determinar la longitud de una suficiente para determinar la longitud de una secuencia multi-byte. Esto hace muy simple extraer secuencia multi-byte. Esto hace muy simple extraer una subcadena de una cadena dada sin elaborar un una subcadena de una cadena dada sin elaborar un análisis exhaustivo. análisis exhaustivo.

UTF-8: VentajasUTF-8: Ventajas

Está diseñado para que los bytes codificados Está diseñado para que los bytes codificados nunca tomen alguno de los valores de los nunca tomen alguno de los valores de los caracteres especiales de ASCII, previniendo caracteres especiales de ASCII, previniendo problemas de compatibilidad con librerías y problemas de compatibilidad con librerías y sistemas operativos legacy como la ANSI C. sistemas operativos legacy como la ANSI C.

Las cadenas en UTF-8 pueden ser ordenadas Las cadenas en UTF-8 pueden ser ordenadas usando rutinas de ordenamiento estándar usando rutinas de ordenamiento estándar orientadas a byte. orientadas a byte.

UTF-8 es el valor predeterminado para el UTF-8 es el valor predeterminado para el formato XML. formato XML.

UTF-8: desventajasUTF-8: desventajas Es de longitud variable; eso significa que diferentes Es de longitud variable; eso significa que diferentes

caracteres toman secuencias de diferentes longitudes para caracteres toman secuencias de diferentes longitudes para codificar. La agudeza de esto podría ser disminuida, sin codificar. La agudeza de esto podría ser disminuida, sin embargo, creando una interfaz abstracta para trabajar con embargo, creando una interfaz abstracta para trabajar con cadenas UTF-8 y haciéndolo transparente al usuario. cadenas UTF-8 y haciéndolo transparente al usuario.

Un analizador de UTF-8 mal escrito podría aceptar un Un analizador de UTF-8 mal escrito podría aceptar un número de diferentes representaciones pseudo-UTF-8 y número de diferentes representaciones pseudo-UTF-8 y convertirlas en la misma salida Unicode. convertirlas en la misma salida Unicode.

Los caracteres ideográficos usan 3 bytes en UTF-8, pero Los caracteres ideográficos usan 3 bytes en UTF-8, pero sólo 2 en UTF-16. Así, los textos sólo 2 en UTF-16. Así, los textos chinos/japoneses/coreanos usarán más espacio cuando chinos/japoneses/coreanos usarán más espacio cuando sean representados en UTF-8. sean representados en UTF-8.

UTF-16UTF-16 E un código de caracteres que proporciona una forma de E un código de caracteres que proporciona una forma de

representar caracteres Unicode e ISO/IEC 10646 como una serie representar caracteres Unicode e ISO/IEC 10646 como una serie de palabras de 16 bits y 24 bits susceptibles de ser almacenados de palabras de 16 bits y 24 bits susceptibles de ser almacenados o transmitidos a través de redes de datos. o transmitidos a través de redes de datos.

UTF-16 se halla oficialmente definido en el Anexo Q de la norma UTF-16 se halla oficialmente definido en el Anexo Q de la norma ISO/IEC 10646-1. También está descrita en el estándar unicode ISO/IEC 10646-1. También está descrita en el estándar unicode (versión 3.0 u superior), al igual que en la RFC 2781 de la IETF(versión 3.0 u superior), al igual que en la RFC 2781 de la IETF

UTF-16 representa un carácter que ha sido asignado dentro del UTF-16 representa un carácter que ha sido asignado dentro del conjunto de los 65536 puntos del código unicode o ISO/IEC 10646 conjunto de los 65536 puntos del código unicode o ISO/IEC 10646 como un valor de código único equivalente al punto de código del como un valor de código único equivalente al punto de código del carácter: por ejemplo, 0 para 0, FFFD hexadecimal para FFFD.carácter: por ejemplo, 0 para 0, FFFD hexadecimal para FFFD.

organización del computador 1 representación binaria de números reales sistemas de...

Documents