IEEE punto flotante

IEEE punto flotante: IEEE punto flotante

Saltar a navegación, búsqueda

El estándar de la IEEE para aritmética en coma flotante (IEEE 754) es el estándar más extendido para las computaciones en punto flotante, y es seguido por muchas de las mejoras de CPU y FPU. El estándar define formatos para la representación de números en punto flotante (incluyendo el cero) y valores desnormalizados, así como valores especiales como infinito y NaN, con un conjunto de operaciones en punto flotante que trabaja sobre estos valores. También especifica cuatro modos de redondeo y cinco excepciones (incluyendo cuándo dichas excepciones ocurren, y qué sucede en dichos momentos, cuando yo quiera).

IEEE 754 especifica cuatro formatos para la representación de valores en punto flotante: precisión simple (32 bits), precisión doble (64 bits), precisión simple extendida (≥ 43 bits, no usada normalmente) y precisión doble extendida (≥ 79 bits, usualmente implementada con 80 bits). Sólo los valores de 32 bits son requeridos por el estándar, los otros son opcionales. Muchos lenguajes especifican qué formatos y aritmética de la IEEE implementan, a pesar de que a veces son opcionales. Por ejemplo, el lenguaje de programación C, ahora permite pero no requiere la aritmética de la IEEE (el tipo de C float es típicamente usado para la precisión simple de la IEEE y el tipo double usa la precisión doble del la IEEE).

El título completo del estándar es IEEE Standard for Binary Floating-Point Arithmetic (ANSI/IEEE Std 754-1985), y también es conocido por IEC 60559:1989, Binary floating-point arithmetic for microprocessor systems (originalmente el número de referencia era IEC 559:1989). [1]

Contenido

1 Anatomía de un número en punto flotante

1.1 Precisión simple 32-bits

1.2 Un Ejemplo

2 Precisión doble 64-bits

2.1 Comparación de números en punto flotante

2.2 Redondeo de números en punto flotante

3 Enlaces externos

Anatomía de un número en punto flotante

Precisión simple 32-bits

Un número en punto flotante de precisión simple se almacena en una palabra de 32 bits.

1 8 23 <-- tamaño en bits +-+--------+-----------------------+ |S| Exp | Mantisa | +-+--------+-----------------------+ 31 30 23 22 0 <-- índice del bit (0 a la derecha) desplazado +127

donde S es el bit de signo y Exp es el campo exponente. (Para el signo: 0=Positivo ; 1= Negativo).

El exponente es desplazado en el un número en precisión simple, un exponente en el rango −126 a +127 es desplazado mediante la suma de 127 para obtener un valor en el rango 1 a 254 (0 y 255 tienen valores especiales descritos más adelante). Cuando se interpreta el valor en punto flotante, el número es desplazado de nuevo para obtener el exponente real.

El conjunto de valores posibles pueden ser divididos en los siguientes:

ceros

números normalizados

números desnormalizados

infinitos

NaN (¬E, no es un número, como por ejemplo, la raíz cuadrada de un número negativo)

Las clases se distinguen principalmente por el valor del campo Exp, siendo modificada ésta por el campo fracción. Considera Exp y Fracción como campos de números binarios sin signo (Exp se encuentra en el rango 0–255):

Clase Exp Fracción

Ceros 0 0

Números desnormalizados 0 distinto de 0

Números normalizados 1-254 cualquiera

Infinitos 255 0

NaN (Not a Number) 255 distinto de 0

Para números normalizados, los más comunes, Exp es el exponente desplazado y Fracción es la parte fraccional de la mantisa (o significando). El número tiene valor v:

v = s × 2^e × m

Donde

s = +1 (números positivos) cuando S es 0

s = −1 (números negativos) cuando S es 1

e = Exp − 127 (en otras palabras, al exponente se le suma 127 y se almacena, a esto también se le llama "biased with 127" en inglés)

m = 1.Fracción en binario (esto es, el significando es el número binario 1 seguido por el punto decimal seguido por los bits de Fracción). Por lo tanto, 1 ≤ m < 2.

Notas:

Los números desnormalizados son iguales excepto que e = −126 y m = 0.Fracción. (e NO es -127 : el significando ha de ser desplazado a la derecha por un bit más, de forma que incluya el bit principal, que no siempre es 1 en este caso. Esto se balancea incrementando el exponente a -126 para el cálculo.)

−126 es el menor exponente para un número desnormalizado

Hay dos ceros. +0 (S es 0) y −0 (S es 1)

Hay dos infinitos +∞ (S es 0) y −∞ (S es 1)

Los NaN s pueden tener un signo y un significando, pero estos no tienen otro significado que el que puedan aportar en pruebas de diagnóstico; el primer bit del significando es a menudo utilizado para distinguir NaN s señalizados de NaN s silenciosos

los NaNs y los infinitos tienen todos los bits a 1 en el campo Exp.

Un Ejemplo

Codifiquemos el número decimal -118.625 usando el sistema de la IEEE 754.

Necesitamos obtener el signo, el exponente y la fracción.

Dado que es un número negativo, el signo es "1". Busquemos los demás valores:

Primero, escribimos el número (sin signo) usando notación binaria. Mira el sistema de numeración binario para ver cómo hacer esto. El resultado es 1110110.101.

Ahora, movamos el punto decimal a la izquierda, dejando sólo un 1 a su izquierda.

1110110.101=1.110110101·2⁶ Esto es un número en coma flotante normalizado.

La mantisa es la parte a la derecha del punto decimal, rellenada con ceros a la derecha hasta que obtengamos todos los 23 bits. Es decir 11011010100000000000000.

El exponente es 6, pero necesitamos convertirlo a binario y desplazarlo (de forma que el exponente más negativo es 0, y todos los exponentes son solamente números binarios no negativos). Para el formato IEEE 754 de 32 bits, el desplazamiento es 127, así es que 6 + 127 = 133. En binario, esto se escribe como 10000101.

Poniendo todo junto:

1 8 23 <-- tamaño en bits +-+--------+-----------------------+ |S| Exp | Mantisa | |1|10000101|11011010100000000000000| +-+--------+-----------------------+ 31 30 23 22 0 <-- índice del bit (0 a la derecha) desplazado +127

Precisión doble 64-bits

La precisión doble es esencialmente lo mismo exceptuando que los campos son de mayor tamaño (más bits por campo):

1 11 52 <-- tamaño en bits +-+-----------+----------------------------------------------+ |S| Exp | Mantisa | +-+-----------+----------------------------------------------+ 63 62 52 51 0 <-- índice del bit (0 a la derecha) desplazado +1023

Los NaN s y los infinitos son representados con todos los bits de los Exp siendo 1 (2047 en decimal).

Para los números normalizados, el exponente es desplazado +1023 (así nuestro ejemplo anterior es Exp - 1023) Para números denormalizados el exponente es -1022 (el mínimo exponente para un número normalizado— no es 1024 porque los números normalizados tienen un bit a 1 delante del punto binario y los números desnormalizados no). Como antes, ambos infinitos y los ceros contienen signo.

Comparación de números en punto flotante

La comparación de números en punto flotante se realiza generalmente usando instrucciones de punto flotante. Sin embargo esta representación (IEEE 754) hace la comparación de determinados subconjuntos posible byte-por-byte, si comparten el mismo orden de bytes y el mismo signo, y además los NaN s son excluidos.

Por ejemplo, para dos números positivos a y b, a < b es cierto siempre que los enteros binarios sin signo con los mismos patrones de bits y el mismo orden de bytes que a y b son también ordenados de forma a < b. En otras palabras, dos números positivos (que se sabe que no son NaN s) puede ser comparados con una comparación entre enteros binarios sin signo entre los mismos grupos de bits, teniendo como base que los números tienen el mismo orden de bytes (esta ordenación, por tanto, no puede ser utilizada a través de una unión en el lenguaje de programación C. Este es un ejemplo de ordenación lexicográfica.

Redondeo de números en punto flotante

El estándar de la IEEE tiene cuatro formas diferentes de redondeo:

Unbiased que redondea al número más cercano, si el número cae en medio, este es redondeado al valor más cercano con un valor par (cero) en su bit menos significativo. Este modo es el requerido como por defecto.

Hacia el cero

Hacia el infinito positivo

Hacia el infinito negativo

Enlaces externos

Referencias IEEE 754

Let's Get To The (Floating) Point por Chris Hecker

What Every Computer Scientist Should Know About Floating-Point Arithmetic by David Goldberg - una buena introducción y explicación.

Curso de Representación de los Datos de Carlos Pes

Comparing floating point numbers Bruce Dawson

Obtenido de "IEEE punto flotante"

Categoría: Aritmética computacional

Clase	Exp	Fracción
Ceros	0	0
Números desnormalizados	0	distinto de 0
Números normalizados	1-254	cualquiera
Infinitos	255	0
NaN (Not a Number)	255	distinto de 0

Игры ⚽ Нужен реферат?

Mira otros diccionarios:

IEEE punto flotante — El estándar de la IEEE para aritmética en coma flotante (IEEE 754) es el estandard mas ampliamente usado para la para las computaciones en punto flotante, y es seguida por muchas de las implementaciones de CPU y FPU. El estandard define formatos… … Enciclopedia Universal
Coma flotante — Se ha sugerido que Tipo de dato real sea fusionado en este artículo o sección (discusión). Una vez que hayas realizado la fusión de artículos, pide la fusión de historiales aquí. La representación de coma flotante, es una forma de notación… … Wikipedia Español
GObject — Una pieza típica del código de inicialización de la clase GObject. El ejemplo muestra una propiedad file size siendo añadida a alguna clase. GLib Object System, o GObject, es una biblioteca de software libre bajo la licencia LGPL que provee un… … Wikipedia Español
NaN — NaN, proviene del acrónimo en inglés Not a Number (en español: no es un número). Este acrónimo se usa generalmente en algunos lenguajes de programación para expresar un resultado imposible de calcular, como el caso de las raíces negativas,… … Wikipedia Español
Sun SPARC — Sun UltraSparc II. SPARC (del inglés Scalable Processor ARChitecture) es una arquitectura RISC big endian. Es decir, una arquitectura con un conjunto reducido de instrucciones. Fue originalmente diseñada por Sun Microsystems y dirigido por el… … Wikipedia Español
Intel 8087 — Coprocesador numérico Intel 8087. Microarquitectur … Wikipedia Español
Java (lenguaje de programación) — Este artículo o sección se encuentra desactualizado. Es posible que la información suministrada aquí haya cambiado o sea insuficiente … Wikipedia Español
Historia del hardware — La máquina analítica de Charles Babbage, en el Science Museum de Londres. El hardware ha sido un componente importante del proceso de cálculo y almacenamiento de datos desde que se volvió útil para que los valores numéricos fueran procesados y… … Wikipedia Español
Lenguaje de programación Java — Saltar a navegación, búsqueda Java Paradigma: Orientado a objetos Apareció en: 1991 Diseñado por: Sun Microsystems Tipo de dato: Fuerte, Estático Implementacion … Wikipedia Español
Historia de los computadores personales — Niños jugando en un computador Amstrad CPC 464 en los años 1980 La historia de los computadores personales comenzó en los años 1970. Un computador personal esta orientado al uso individual y se diferencia de un computador mainframe, donde las… … Wikipedia Español

Los diccionarios y las enciclopedias sobre el Académico

IEEE punto flotante

IEEE punto flotante

Contenido

Anatomía de un número en punto flotante

Precisión simple 32-bits

Un Ejemplo

Precisión doble 64-bits

Comparación de números en punto flotante

Redondeo de números en punto flotante

Enlaces externos

Mira otros diccionarios:

Compartir el artículo y extractos

Los diccionarios y las enciclopedias sobre el Académico

Wikipedia Español

IEEE punto flotante

IEEE punto flotante

Contenido

Anatomía de un número en punto flotante

Precisión simple 32-bits

Un Ejemplo

Precisión doble 64-bits

Comparación de números en punto flotante

Redondeo de números en punto flotante

Enlaces externos

Mira otros diccionarios:

Compartir el artículo y extractos

Link directo